Kimi K2.7 Code深测:专注编程场景,长上下文指令遵循与成本控制双突破
Fable 5发布后,其音乐流体模拟器效果令人印象深刻,不少人第一时间用它跑出了惊艳案例。

当Kimi推出最新的K2.7 Code编程模型时,我决定用同样的流体模拟case来检验它的表现,结果超出了预期。
同时顺手跑了英伟达财务模型,完成度同样很高。
这里无意将K2.7与Fable 5直接对比,毕竟二者定位完全不同。但K2.7在Coding能力上展示出的硬实力,确实值得单独聊一聊。
官方描述:
Kimi K2.7 Code相对K2.6,在长上下文编程场景中的指令遵循能力大幅提升,长程任务表现更稳定,同时改善了长任务中“过度思考”的问题,平均token消耗减少了30%。
这是其基准表现:

简单来说,在Coding能力上它略逊于Opus 4.8和GPT 5.5(xhigh),但Agentic场景下可以打成平手。与自家的K2.6对比,提升显著,特别是编程方面。
模型依旧开源,关键参数如下:
| 项目 | 参数详情 |
|---|---|
| 上下文窗口 | 256K |
| 价格 | ¥6.5 / ¥27 百万Token(输入/输出) |
| 多模态 | 支持,图片+视频 |
| Thinking | 强制开启,不开则变为K2.6 |
| 模型ID | kimi-k2.7-code |
| 高速版 | 6倍速度,2倍价格 |

一手实测
模型发布后,我立即接入进行了一系列测试,下面展示关键结果。
1. 制作音乐流体模拟器
这次不采用vibe coding方式。先让K2.7观看Fable-5的demo视频。

得益于K2.7的多模态能力,它能直接理解png、jpeg、webp、gif等图片格式,以及mp4、mov、webm、avi等视频格式,因此这段演示它看得一清二楚。随后它输出了一份技术方案。

根据该方案,设计了一个基于物理的流体/烟雾运动的“音乐流体模拟器”HTML,重点实现丝绸般尾迹随音乐节奏舞动的效果。

最终产物如下:
效果确实很出色。虽然没有100%还原Fable-5的水准,但流体运动和烟雾轨迹的完成度非常高。后续我还追加了混音调节、上传本地音乐和麦克风录音等功能。

体验下来,最明显的感受是K2.7在长程任务中的指令遵循能力确实有所提升,这对真实编程场景尤其重要,因为很多时候上下文会接近填满。很多模型在上下文接近极限时容易顾此失彼,而K2.7显得更有“全局观”。
值得注意的是,Kimi Code的CLI会清晰展示当前上下文占用情况——你用了多少、总剩余多少,一目了然。

2. 制作财务模型
接着测试“看图建模”场景。将一张财报图丢给模型,要求按图表数据与布局制作可交互的HTML财务模型。
提示词:
图“英伟达Q1财报.png”是英伟达2027财年第一财季的收入报表,请根据这张图片做一个可以互动的html,使用canvas和js组件严格按照比例还原这个报表,并且将内容全部翻译为中文,收入单位为亿美元。
需要实现的效果有:
1.点击每个子项后,收入报表缩小,空出来的部分放大展示这个卡片,展示它的收入或支出占比,以及展示一个排行榜(它排在收入或支出的第几位)。
2.再次点击后,卡片消失还原收入报表的展示。
这个任务强烈考验视觉理解、空间布局、基础财务知识和Canvas编程能力,数据必须零差错。最终交付的产品非常让人满意,所有卡片均可正常展开缩放,收支数据完全匹配。

3. 开发民宿官网
依旧沿用经典案例:为“冷同学的院子”设计官网。提示词与过往横评完全一致,一字未改。
给这家民宿设计一个官网。
民宿的基本信息:
- 民宿名称:冷同学的院子
- Slogan:云朵上的院子,冷同学的家
- 地理位置:四川汶川(羌族文化核心区、高山峡谷地带)
- 品牌调性关键词:温暖治愈 · 在地羌韵 · 自然松弛 · 外冷内热 · 有故事感
- 目标客群:追求慢生活的年轻人、亲子家庭、文化旅行者、成都周末度假客、川西旅游爱好者
文件夹【民宿资料包】放着很多民宿的素材,有logo、门店、房间、周边和宣传视频,你自己决定用哪些素材(不是所有素材都用上)。我需要最终交付的网站顶级审美,让人看了就想马上去玩。
One shot直出,效果如下:
K2.7的前端审美可以说与M3、Opus 4.8处于同一水平。多模态能力对编程任务的视觉品味加成明显——若仅依靠纯文字提示,很难达到这个层次。
4. 3D任务
还是我们熟悉的3D魔方测试。
提示词:
Create a single HTML file containing a fully functional 3D Rubik's Cube simulation using Three.js (via CDN). The cube must be able to automatically solve itself.
功能完成度方面,打乱和还原都没有问题。

有意思的是,K2.7自行在UI面板上加上了6个面的手动操作按钮和速度调节功能,3D渲染的光影细节也更写实。这种“超需求”的细节加分不少。

5. 长程任务
虽然官方建议“非编程场景推荐使用更全面的K2.6”,我还是尝试了一个联网搜索+Office三件套生成+skill调用+网页开发的复杂长程任务。
提示词:
联网检索腾讯2025年的关键财报信息,构建腾讯的营收模型,读取权威研报内容,合理假设,基于最新的信息对腾讯营收建模,分别出一份 Word 研究报告和 Excel 图表,然后调用 guizang-ppt-skill 生成一份PPT。
模型给出的财务预测是:腾讯2026年营收8488亿,增长12.9%,Non-IFRS净利润2596亿,增长17%。

背后是一套依托历史数据的总结与分析。

研究报告详细阐述了预测推导过程。

(可上下滑动,查看全图)
PPT也完整输出。

三份产物大大超出预期。这个任务不是简单的信息收集与总结,而是要求模型做出自主预测、推理和判断,对长程稳定性、工具调度和推理能力要求极高。K2.7的长程能力确实扎实。
6. 成本总结
最后看成本。上述5个case加上其他未展示的测试,一共跑了大约10多个任务,消耗了本周总用量的9%。

换算下来约15元。在Kimi Code Plan下,这个价格完全可以接受。
据悉,下周一会上线Kimi K2.7 Code高速版,输出速度可达180 Token/s,短上下文场景甚至能到260 Token/s,是普通版的5-6倍,而价格仅为2倍。官方同时开启为期三周的充赠活动,充500元以上赠送20%-30%的券。

对重度编程用户,尤其是在Agent工作流中需要长上下文稳定、指令不丢失,又希望控制成本的场景,K2.7 Code值得尝试。纯对话与办公任务则依旧推荐K2.6。

总结
整体跑下来,K2.7 Code的定位非常清晰:不争全能,只专注把Coding这件事做好。在长程编程、Agent编程、3D、前端甚至办公任务上都有稳定表现,减少无谓的思考,token消耗肉眼可见地下降。
就像第5个长程任务,上下文占用仅拉到50%,远未打满。这意味着费用更低,质量更高——Coding能力的提升自然带动了Agentic表现。对于有重度编程需求、跑Agent工作流的用户来说,这是一个定位准确、务实的选择。


