最快开源模型 Step 3.7 Flash 发布：兼顾速度与智能的 Agent 效率利器

June 20, 2026

近两年来，国产大模型的能力演进方向耐人寻味。
2024 年，行业还在疯狂内卷单个场景的上限——MMLU 分数能刷多高、MATH 能答对多少、编程排名第几。
2025 年，Agent 赛道上道，长程任务规划、多步执行、工具调度成为主流。
到了 2026 年，效率突然被推上台前，变成了新的争夺高地。

原因很直接：复杂任务从指令下达到最终交付，往往要等上几十分钟，甚至数小时，体验实在不算好。
就在这种背景下，极致高效的 Step 3.7 Flash 开源登场。

这个开源模型同时抓住了速度、智能和成本三极。最高生成速度达到 400 TPS，原生支持多模态能力，可以高效率完成真实生产级任务——无论是编程、办公还是搜索，都表现得毫不拖泥带水。

姗姗来迟的「闪电」

很长一段时间里，一听到「Flash」这名字，大多数人的第一反应就是“快、便宜，但不够聪明”。
Step 3.7 Flash 的出现，恐怕要把这张标签撕下来了。

它本质上是一个为 Agent 效率而生的 Flash 模型，专门针对生产级 Agent 场景设计。

有开发者很快将其接入到 GitHub 开源项目 Lumi（一个常驻电脑的 AI 助手，用语音唤醒即可干各种活）中，新增了 Step 模型供应商选项，默认模型设为 Step 3.7 Flash。

实测下来，不到 3 分钟就完成了一个新 feature 的开发，一次成功且没有报错，整个过程相当丝滑。
接下来又用它让 AI 语音助手“钱多多”同时执行两个任务：整理桌面，并撰写一篇关于 AI 大模型发展史的文章。结果不到一分钟，两项任务全部高质量完成。换成其他模型，至少也要小十分钟。

这是 Step 3.7 Flash 最核心、也最容易被误解的一点。
生产级的 Agent 任务绝不只是单次问答，而是一个不断循环的完整链路：规划、推理、搜索、工具调用、代码生成、多模态理解、反复修正……所有环节环环相扣。

这也是为什么，在干复杂脏活累活的 Agent 评测榜单上，这款速度极快的模型有底气与国际上最顶尖、最昂贵的模型掰手腕——真正拉开差距的，是 Agent Loop 每一次循环中的综合效率，而不仅仅是某个 Benchmark 上的冰冷分数。

多模态不是 Step 3.7 Flash 的附加功能，而是它的原生组成部分。

一个典型例子：让它把桌面上 10 张发票图片的关键信息提取出来，并整理成表格。仅仅 20 秒，OCR 信息提取加表格录入一气呵成，又快又准。

这意味着，你不再需要额外编排一个视觉模块来处理截图、文档或界面影像。模型自己就能理解视觉内容，并将这个能力无缝嵌入到 Agent 的执行流程中，场景边界被大大拓宽。

在传统工作流里，搜索通常是个独立步骤，Agent 需要信息时，调用搜索工具，把结果喂回模型。
Step 3.7 Flash 对搜索能力做了重点升级，让搜索更像是 Agent 思考与行动的自然延伸。

它可以更高效地获取上下文、理解信息、验证结果，并基于更及时的资料完成任务。在真实场景中，一轮对话里可能需要多次搜索，每次都要求快、准、少占上下文窗口，而这恰好直接决定了 Agent 的决策质量和响应速度。

Step 3.7 Flash 是一款开源模型。
你可以将它部署在自己的基础设施上运行，所有数据始终留在自己的环境中。

开源地址：https://github.com/stepfun-ai/Step-3.7-Flash

好消息是，这样高效的模型个人用户同样用得上。
它可以便捷地接入 Claude Code、OpenClaw 等各类 Agent 工具，Step Plan 就已支持。