Claude递归自我改进路线图:代码产出8倍暴增、实验速度飙至52倍,Anthropic首次披露内部实测
#递归自我改进 #AI研发加速 #Claude

Anthropic罕见地公开了内部数据:Claude已经将工程师的代码产出提升至2021–2025年水平的8倍,实验速度则在一年内从3倍跃升到52倍。这不再是单纯的“提效工具”,而是整个AI研发流程正在被AI自己重新编织。
从辅助编码到接管完整研发循环
过去一年,“AI加速研发”早已被奉为行业共识,但究竟加速到何等程度、能否反过来驱动下一代的AI,一直缺乏可验证的实证。6月4日,Anthropic同步通过官网和社交平台披露了内部研究,罕见地展示了代码贡献率、实验速度和研究判断力三条曲线的详尽数据,并首次将“递归自我改进”从理论假设推入内部的研发路线图。


核心数据集中在两个维度。在工程方面,截至2026年5月,Anthropic合并到生产系统里的代码超过80%由Claude撰写;作为对比,2021年至2025年同期数据还是个位数。产出的变化直观可见:2026年第二季度,每位工程师日均合并代码量达到2024年的8倍。在科研方面,同一项实验任务,Claude Opus 4(2025年5月)平均只带来约3倍的速率提升,而Claude Mythos Preview(2026年4月)已跃升到约52倍。一位熟练的人类研究员跑完类似的优化实验,通常需要4到8小时才能达到4倍速。
内部研发角色的三阶压缩
Anthropic内部采用了一套简单的分层标准来描述角色的进阶:早期员工执行别人指定的具体任务;积累经验后被交付“目标”,需要自己设计实现路径;最资深的阶段则是负责决定“下一个季度该解决什么问题”。Claude的能力正由浅入深地替代前面这三个层级。
在工程侧,Claude已经能够接管粗粒度的需求描述,并自主寻找解决方案;在科研侧,它对于“目标清晰、实验步骤明确”的研究任务,已经可以匹敌熟练的研究者。真正依旧存在差距的,是“判断哪些目标值得投入”这一决策层面。这恰恰是递归自我改进能否成立的关键关口:只要AI还不能自主选择科研方向,人类就依然是闭环中不可替代的决策节点。
文章中有一个细节值得深究:2026年4月,Anthropic让Claude独立执行了一个端到端的安全研究项目,目标是测试弱模型能否可靠地监督强模型。两名人类研究员花费一周时间只找回了约23%的能力差距;而AI agent通过800小时、大约1.8万美元的算力开销,完成了97%的差距恢复。方向选取与评分标准仍由人类设定,但假设生成、实验设计和迭代工作全部由AI自动完成。
三种可能路径,不同的时间尺度
Anthropic为自身的递归自我改进规划了三条可能路线。第一种,当前的能力增长曲线骤然走平。这可能源于S曲线的拐点、算力或能源供给的瓶颈,或者监管的强力冲击。第二种,效率持续滚雪球式提升,但人类仍牢牢掌握方向设定和结果审核。公司内部已经出现这类迹象:人类代码评审正在变成新的瓶颈,而新想法、新工具、新实验的数量已经超出了团队的消化能力。第三种,AI获得足够的研究品味与实验设计能力,开始自行设计并训练下一代模型,真正的递归闭环就此形成。
文中给出的最关键判断是:“研究品味可能只是另一种AI会暂时失败、然后再次变强的能力。”从讲解幽默、推断心理理论,到解决语言谜题,AI已经反复复现了“先不行、再超预期”的曲线。正因如此,Anthropic自己对第三条路线虽然不作承诺,但也未将其视为遥远的假设。
普通人能切身感受到的三重影响
第一重是研发效率本身。2026年中期已经浮现出一种新现象:一个100人的团队借助AI agent的产出,在部分任务上可以等效过去1000人的规模。这并非理论推演,而是代码提交量、实验迭代速度、漏洞发现数量等硬指标直接给出的结论。
第二重是验证窗口正在急剧收窄。Anthropic提到,Glasswing项目已经能够在数周之内发现上万处高危漏洞,网络安全防御的瓶颈已从“发现”转向“修复速度”。同理,如果AI自主设计下一代模型的速度超过了人类设计验证机制的速度,安全对齐就不再是纯粹的研究课题,而会演变成工程竞速的困局。
第三重是竞争格局的质变。Anthropic明确表示,如果能够构建有效的暂停或减速验证机制,他们愿意在全球其他前沿实验室同步执行时主动暂停。但训练运行比导弹发射井更易于隐藏,所需的inputs是通用硬件,参与者叛离的激励极大。这种不对称意味着,任何相信“递归自我改进会在某一年到来”的人,都必须同时面对一个拷问:谁来验证大家真的已经停下了脚步。
回到普通人的视角,这篇文章最值得被带走的问题不是“AI会不会取代你”,而是“你的工作流里,有哪些环节正在被AI代理接管,以及你能否分辨哪些环节其实已经不再需要人来操作了”。
自查是否已进入加速区间的三个简单信号
- 你或身边的同事是否还在“手写代码”,还是只剩下“指导Claude写代码”这一动作。
- 实验从“提出需求到获得结果”的耗时是否在按月缩短,而非按年迭代。
- 团队近期新增的想法、工具或实验是否已经多到无法全部推动执行。
来源:Anthropic, “When AI builds itself” https://www.anthropic.com/institute/recursive-self-improvement