最快开源模型 Step 3.7 Flash 发布:兼顾速度与智能的 Agent 效率利器
近两年来,国产大模型的能力演进方向耐人寻味。
2024 年,行业还在疯狂内卷单个场景的上限——MMLU 分数能刷多高、MATH 能答对多少、编程排名第几。
2025 年,Agent 赛道上道,长程任务规划、多步执行、工具调度成为主流。
到了 2026 年,效率突然被推上台前,变成了新的争夺高地。

原因很直接:复杂任务从指令下达到最终交付,往往要等上几十分钟,甚至数小时,体验实在不算好。
就在这种背景下,极致高效的 Step 3.7 Flash 开源登场。

这个开源模型同时抓住了速度、智能和成本三极。最高生成速度达到 400 TPS,原生支持多模态能力,可以高效率完成真实生产级任务——无论是编程、办公还是搜索,都表现得毫不拖泥带水。
姗姗来迟的「闪电」
很长一段时间里,一听到「Flash」这名字,大多数人的第一反应就是“快、便宜,但不够聪明”。
Step 3.7 Flash 的出现,恐怕要把这张标签撕下来了。
它本质上是一个为 Agent 效率而生的 Flash 模型,专门针对生产级 Agent 场景设计。
有开发者很快将其接入到 GitHub 开源项目 Lumi(一个常驻电脑的 AI 助手,用语音唤醒即可干各种活)中,新增了 Step 模型供应商选项,默认模型设为 Step 3.7 Flash。

实测下来,不到 3 分钟就完成了一个新 feature 的开发,一次成功且没有报错,整个过程相当丝滑。
接下来又用它让 AI 语音助手“钱多多”同时执行两个任务:整理桌面,并撰写一篇关于 AI 大模型发展史的文章。结果不到一分钟,两项任务全部高质量完成。换成其他模型,至少也要小十分钟。

四大亮点,逐一拆解
① Agent 效率:看的是整条链路,不只看 Benchmark
这是 Step 3.7 Flash 最核心、也最容易被误解的一点。
生产级的 Agent 任务绝不只是单次问答,而是一个不断循环的完整链路:规划、推理、搜索、工具调用、代码生成、多模态理解、反复修正……所有环节环环相扣。

这也是为什么,在干复杂脏活累活的 Agent 评测榜单上,这款速度极快的模型有底气与国际上最顶尖、最昂贵的模型掰手腕——真正拉开差距的,是 Agent Loop 每一次循环中的综合效率,而不仅仅是某个 Benchmark 上的冰冷分数。
② 原生多模态:视觉理解直接嵌入工作流
多模态不是 Step 3.7 Flash 的附加功能,而是它的原生组成部分。
一个典型例子:让它把桌面上 10 张发票图片的关键信息提取出来,并整理成表格。仅仅 20 秒,OCR 信息提取加表格录入一气呵成,又快又准。

这意味着,你不再需要额外编排一个视觉模块来处理截图、文档或界面影像。模型自己就能理解视觉内容,并将这个能力无缝嵌入到 Agent 的执行流程中,场景边界被大大拓宽。
③ 搜索:不再是工具调用,而是思考的一部分
在传统工作流里,搜索通常是个独立步骤,Agent 需要信息时,调用搜索工具,把结果喂回模型。
Step 3.7 Flash 对搜索能力做了重点升级,让搜索更像是 Agent 思考与行动的自然延伸。
它可以更高效地获取上下文、理解信息、验证结果,并基于更及时的资料完成任务。在真实场景中,一轮对话里可能需要多次搜索,每次都要求快、准、少占上下文窗口,而这恰好直接决定了 Agent 的决策质量和响应速度。
④ 完全开源,数据不出门
Step 3.7 Flash 是一款开源模型。
你可以将它部署在自己的基础设施上运行,所有数据始终留在自己的环境中。

开源地址:https://github.com/stepfun-ai/Step-3.7-Flash
如何使用?
好消息是,这样高效的模型个人用户同样用得上。
它可以便捷地接入 Claude Code、OpenClaw 等各类 Agent 工具,Step Plan 就已支持。

相关指引整理如下:
- 接入 Step 3.7 Flash:
https://platform.stepfun.com/docs/zh/guides/models/step-3.7-flash - Step Plan 订阅:
https://platform.stepfun.com/step-plan - Step Plan 接入:
https://platform.stepfun.com/docs/zh/step-plan/quick-start
不论是个体开发者,还是需要处理大量生产级业务的企业,这波“闪电”的效率红利,或许都值得一试。