AI编程智能体撞脸实录:Codex与Claude Code功能趋同全景解析
一、一张时间线图,揭开AI编程圈"双胞胎"的秘密
2026年6月初,开发者 Elie Bakouch 在 X 平台抛出一张令人瞩目的对比图。
这幅信息图绘制了从2025年2月绵延至2026年6月的时间轴,将 Claude Code 与 Codex 的相似功能逐一锚定在发布时间坐标上。橙色标记归属 Claude Code,蓝色则代表 Codex。
每一行条目都是双方共享或高度近似的功能:/goal指令、子智能体系统、上下文压缩机制、沙箱环境、技能库模块、dreaming 记忆引擎……
这张功能图谱在开发者社区激起层层涟漪,因为数据结论犀利到令人无法忽视:
| 统计维度 | 数据 |
|---|---|
| 共有相似功能 | 24项 |
| Claude Code 先发 | 18项 |
| Codex 先发 | 4项 |
| 存在争议 | 2项 |
18:4的悬殊比例。 橙色(Claude Code)几乎覆盖了时间轴的前半段版面。
Elie 并非凭印象论断。他交叉核验了 npm 发布记录、GitHub Release 日志和官方技术博客,逐条考据了每一项功能的首次亮相时间。
来源:Elie Bakouch 的 X 帖子及 GitHub Gist,36氪/新智元 2026-06-08 报道
二、11天——新功能的领先窗口正以"天"为单位消失
18:4 的统计已足够触目惊心。但更让人心头一紧的是追赶加速度。
Codex 率先推出的4项功能
身为后来者的 Codex(Claude Code 2025年2月推出,Codex 编程智能体同年5月才亮相),同样拥有原创时刻:
| 功能 | Codex 先发时间 | Claude Code 追平时间 | 追平耗时 |
|---|---|---|---|
| 内置沙箱 | Codex 早期优势 | Claude Code 后续跟进 | — |
| 云端异步智能体 | Codex 率先推出 | — | 仍处于领先 |
| 目标模式(Goal mode) | Codex 首发 | Claude Code 实现对齐 | 11天 |
| 多智能体并行 | Codex 先发 | Claude Code 跟进实现 | 11天 |
发现了没?区区11天。
Codex 率先发布的4项功能中,至少有2项被 Claude Code 在约11天内迎头赶上。在软件开发领域,11天甚至塞不满一个标准的 sprint 周期。
注:追平天数依据 Elie Bakouch 的原始时间线对照得出(交叉 npm 发布日志、GitHub Release 和官方博客),精确天数以原始数据为准。
Claude Code 率先建立的18项功能
另一端,Codex 追赶 Claude Code 的时间线则长得多。Claude Code 凭借约80天的先发时间窗,在这18项功能上展开了密集迭代的节奏:
- • 无界面脚本化模式(headless)
- • 模型上下文协议(MCP)
- • 自定义斜杠命令系统
- • 上下文压缩引擎
- • 子智能体(subagents)
- • 生命周期钩子(hooks)
- • 技能库体系(skills)
- • ……以及更多模块
Claude Code 用约一年时间筑起了这18项功能的先发壁垒。而 Codex 项项紧追,追得极快,但差距依然可辨。
来源:36氪/新智元 2026-06-08,Elie Bakouch 对比数据
三、连命名都撞了:一个字符级的对标现象
功能相近尚且可以理解。问题在于——连命名都如出一辙。
撞名之一:/btw 命令
Claude Code 内置的 /btw 命令,用于侧边栏提问——不打断主工作流,随时插入一句咨询。
Codex 的对等命令名为 /side,功能几乎完全一致。而社区用户已在提议将 /btw 添加为别名——连命名都想拉平。
撞名之二:SKILL.md 格式
双方不约而同采用 SKILL.md 作为技能系统的文件格式规范。
这套格式最早由 Anthropic 发起,随后开放为行业标准。如今 Claude Code 支持、Codex 支持、Cursor 支持、Gemini CLI 支持,连 VS Code 也已兼容。
一场跨平台的标准化浪潮——这意味着你编写的一份技能文件,可在所有主流 AI 编程工具中通用。
撞名之三:Dreaming 记忆机制
Anthropic 为 Claude Managed Agents 打造了一项名为 dreaming 的机制——能回溯历史会话、发现规律、自我优化。2026年5月初正式公开。
同年6月初,OpenAI 也为 ChatGPT 部署了同名的 dreaming 记忆系统。
虽然这两个 dreaming 在技术实现上并非同一概念——Anthropic 的植根于托管智能体平台,OpenAI 的扎根于 ChatGPT 记忆系统——但名称撞了,理念也撞了。
撞名之四:Goal 模式
Claude Code 的 /goal 命令:设定一项完成条件,它会跨多轮持续工作,每完成一轮由一个小模型裁决条件是否达标,未达成则继续迭代。
Codex 的 Goal mode:给定一个持久目标,Codex 朝这个方向一轮轮推进下去,几小时甚至数天无需人工干预。
同一套机制,两家各自实现了一份。
四、不是抄袭,是形态收敛
读到这里,你或许会疑惑:是否有一方在模仿另一方?
真相远比这个猜想复杂。
为什么会"撞脸"?
AI 编程智能体这个产品形态,正在不可逆转地收敛成一个确定的轮廓。
你可以将 AI 编程智能体想象成一架航空器。不管谁制造,最终都会有驾驶舱、推进系统、导航设备、安全防护——不是模仿的结果,而是因为这就是"航空器"的本质形态。
对于 AI 编程工具而言,这些"驾驶舱"和"推进系统"表现为:
| 必然模块 | 必然性的根源 |
|---|---|
| 长任务/目标模式 | 开发者需要AI持续运行数小时而无需值守 |
| 子智能体 | 复杂任务必须拆解并行处理 |
| 上下文压缩 | 长会话无法回避上下文精简 |
| 沙箱隔离 | 安全基线要求代码在隔离环境中运行 |
| 插件/技能生态 | 不可能内置全部能力,必须对外开放 |
| 记忆系统 | 长期使用必然依赖经验积累 |
| 自定义命令 | 开发者必须能定制个人工作流 |
不管谁来做 AI 编程智能体,最终都会具备这一整套能力体系。
Elie 自己的结论
Elie 抛出那张时间线,本意是想为两方划出高低。但他最终得出了一个更耐人寻味的结论:
功能矩阵本身已不再构成护城河。真正的分水岭,已从"有没有这个功能"升维到"这个功能究竟做成什么样"。
同一项功能——
- • 谁的响应延迟更低?
- • 长任务的成功率更高?
- • 自动压缩更干净?
- • 权限控制更安全?
- • 运行成本更低?
这些才是真正的较量维度。
五、起了个大早,赶了个晚集:Codex 的先发优势之谜
这里有一段被多数人忽略的历史暗线。
“Codex"这个名字并非2025年才诞生。
OpenAI 早在 2021年 就发布了 Codex 模型——通过自然语言生成代码。这是 OpenAI 的战略级产品之一,比 GitHub Copilot 的底层技术更早露面。
但 Elie 对比的并非2021年的 Codex 模型,而是2025年才登场的 Codex 编程智能体。
时间轴揭示如下:
| 时间 | 事件 |
|---|---|
| 2021年 | OpenAI 发布 Codex 模型(专注代码生成) |
| 2025年2月 | Anthropic 推出 Claude Code(终端编程智能体) |
| 2025年5月 | OpenAI 推出 Codex 编程智能体 |
| 2026年2月 | Codex 桌面客户端上线 |
| 2026年6月 | Codex 宣布并入 ChatGPT |
OpenAI 明明在 AI 编程领域抢了先机(2021年),却将编程 Agent 的先发优势拱手让给了 Claude Code(2025年)。
旧 Codex 证明了"模型能写代码”,Claude Code 则率先把这件事打磨成开发者愿意每日使用的智能体产品。
这是一个典型的"创新者困境"——你拥有核心技术,却未能将其转化为正确的产品形态。等你回过神来,对手已经跑出去80天了。
六、用户数据:谁在占据上风?
功能对比只是表层现象,用户数据才能映照真实格局。
使用量变迁轨迹
| 时间节点 | Codex 使用量 / Claude Code | 来源 |
|---|---|---|
| 2025年9月 | Codex 仅为 Claude Code 的 5% | WIRED |
| 2026年1月 | Codex 升至 Claude Code 的 ~40% | WIRED |
| 2026年4月30日 | Codex npm 下载量反超 Claude Code | 第三方统计 |
| 2026年5月(单周) | Codex 8610万次 vs Claude Code 720万次 | DoNews |
两个维度的"赢"
但这里隐藏着一个关键界定:怎样定义"赢"?
按"每周有多少人打开"——Codex 在实现反超:
| 指标 | Codex | Claude Code | 来源 |
|---|---|---|---|
| 周活跃用户 | 500万+ | ~200万(估算) | OpenAI/第三方 |
| npm 月下载量(近30天) | ~1400万 | ~4630万 | 第三方统计 |
注:Codex 在5月初曾出现单周爆发式增长(单周8610万次下载),但月度 npm 下载量因统计口径差异(仅计 CLI 包)与周活口径不同,两者不完全可比。
注意观察——周活 Codex 反超了,但 npm 下载量 Claude Code 依然是 Codex 的 3倍有余。
原因何在?
因为 Codex 的500万里,非开发者占比20%,且增速达到开发者的3倍。这是将"编程工具"扩展成"办公平台"后的数字效应。
在更纯粹的开发者侧,Claude Code 仍然占据上风。
一句话概括:论"每周打开频次",Codex 已实现反超;论"开发者的使用深度",Claude Code 仍保持领先。
七、开发者"倒戈"潮:可靠性成为决胜变量
值得 Anthropic 警惕的,是部分重量级开发者的阵营转移。
Simon Last(Notion 联合创始人)
WIRED 援引了他的表述:
他和核心工程师在 GPT-5.2 前后转向了 Codex,理由是可靠性。
“Claude Code 会对我撒谎。"——Simon Last,WIRED 采访
Peter Steinberger(OpenClaw 创建者)
2025年底,他基于 Codex CLI 构建了开源项目 OpenClaw,自称常在 3x3 终端网格里并行运行 3 到 8 个 Codex 实例。2026年2月——他本人加入了 OpenAI。
他讲述自己常在 3x3 终端网格里并行启动 3 到 8 个 Codex 实例。
为什么可靠性成为决胜手牌?
这些"阵营转换"案例揭示了一股趋势:
当功能列表日趋一致时,开发者选择工具的准则,从"谁功能更多"迁移到"谁更值得信赖”。
- • Codex 的优势:稳定性、长任务不中断、多端同步能力
- • Claude Code 的优势:代码质量更深、理解上下文更准确、推理更细致
Reddit 上一位开发者的评论切中要害:
“Claude 像一位靠谱的资深同事,会自主做端到端测试,遇到报错主动帮你排查环境。Codex 更像一个技术精湛的外包极客,代码能跑但架构风格粗犷。”
八、两种打法的底层分野
虽然功能在趋同,但两家的底层逻辑截然不同。
Claude Code:终端里的自主工程师
路线:先在命令行里将开发者工作流吃深吃透
→ 再用 hooks、子智能体、技能、插件向外延伸
→ 终极形态:开发者的操作系统
Claude Code 的基因深植终端。它从命令行出发,先深耕开发者工作流——理解代码库、跨文件重构、长会话推理。然后通过 hooks、subagents、skills 向外生长。
Codex:多端协同工作台
路线:把命令行 + IDE + 桌面App + 手机远程 + 云端任务融成一体
→ 再透过角色插件向非开发者渗透
→ 终极形态:全员 AI 办公平台(即将并入 ChatGPT)
Codex 的基因是平台化。它从云端起步,覆盖命令行、IDE、桌面应用、手机远程控制,现在还要添上 ChatGPT 的9亿用户入口。
一张图揭示差异
| 维度 | Claude Code | Codex |
|---|---|---|
| 起点 | 终端命令行 | 云端智能体 |
| 核心用户 | 开发者 | 开发者 + 非开发者 |
| 扩展方向 | 从深到广 | 从广到深 |
| 强项 | 代码质量、深度推理 | 稳定性、多端同步 |
| 弱项 | 额度消耗快、稳定性争议 | 代码深度不足 |
| 生态打法 | hooks + skills + MCP | 插件 + Sites + ChatGPT 合并 |
| 终极目标 | 开发者的操作系统 | 全员的 AI 办公平台 |
虽然打法各异,两者的目标却意外交汇:都不甘心只当 IDE 里的一个插件,都想成为开发者每天打开的第一个入口,成为个人和企业的操作系统。
九、差异化窗口正在急速关闭
Elie 那张时间线映照出最冷酷的现实:
AI 编程智能体的差异化窗口,正在以肉眼可见的速度关闭。
2025年初,两家差距悬殊——Claude Code 拥有18项独占功能,Codex 才刚刚起步。
2026年中,两家的功能矩阵已高度重叠。任一新功能发布,对手的追赶速度精确到以天计算。
这预示着什么?
对开发者的影响
好消息:无论选哪个,功能都足够完整。你不会因缺少某项功能而受限。
坏消息:选择变得更难了。不再是"谁功能更多",而是"谁的体验更佳"——这种判断需要你亲自上手、深度使用才能沉淀出来。
对行业的影响
功能趋同意味着竞争已跨入新阶段:
| 阶段 | 竞争焦点 | 时间 |
|---|---|---|
| 第一阶段 | 谁的模型更强 | 2024-2025 |
| 第二阶段 | 谁的功能更多 | 2025-2026 |
| 第三阶段 | 谁的体验更优 | 2026- |
第三阶段的决胜变量:
- • 可靠性:长任务不崩溃、不撒谎、不捏造
- • 成本效率:同等质量下谁更经济
- • 生态深度:插件、技能、第三方集成的丰富度
- • 用户基数:Codex 背靠 ChatGPT 9亿用户,Claude Code 依靠开发者口碑
十、给普通人的建议
如果你正在选择第一个 AI 编程工具
两个都体验一下。
- • 先试 Codex:上手更平滑,多端支持好,非开发者友好度高
- • 再试 Claude Code:代码质量更深,推理更细微,适合重度开发者
如果你已经在使用其中一个
无需仓促切换。 功能趋同意味着你不会因为选错了而承受大损失。真正重要的是深度使用——用得越多,工具越理解你的习惯。
如果你是企业管理者
关注两件事:
- Codex 即将并入 ChatGPT:如果你的公司已在用 ChatGPT Enterprise,Codex 能力会自动解锁
- Claude Code 在开发者社区的口碑更扎实:如果你的团队以开发者为主体,Claude Code 可能是更稳健的选择
写在最后:长得一样,不意味着灵魂相同
Codex 和 Claude Code 越来越像——24项功能对齐,连命名都撞了。
但这绝不意味着两者没有差别。
就像两款驾具都有动力系统、操控装置、安全配置、导航模块——功能清单一模一样,但驾驶起来的感受截然不同。
Claude Code 更像一个深度思考的工程师:它理解你的代码库、找到隐藏的依赖、做出更审慎的决策。
Codex 更像一个全能型助手:它响应更快、多端同步、稳定性好、还能帮你搭建网站、制作演示、撰写报告。
功能在趋同,但灵魂不一样。
而这场贴身肉搏,才刚刚启幕。
参考来源:
- • 36氪/新智元:Codex 撞脸 Claude Code,新功能只领先11天(2026-06-08)
- • 知乎:炸裂!Claude Code 和 Codex 撞脸了,24项功能几乎一模一样(2026-06-08)
- • CSDN:24项功能18:4!我用真实数据扒了 Claude Code 和 Codex 的底裤(2026-06-08)
- • 搜狐:Claude Code 与 Codex 功能趋同,差异化竞争成关键(2026-06-08)
- • Elie Bakouch X 帖子及 GitHub Gist(2026-06-07)
- • WIRED:Codex vs Claude Code 用户增长报道(2026)
- • DoNews:Codex npm 下载量达 Claude Code 12倍(2026-05)
- • 知乎:Codex 五月下载量反超 Claude Code 大逆转原因分析(2026-05)
- • OpenAI 官方:Codex 周活500万+公告(2026-06-02)