AI编程智能体撞脸实录：Codex与Claude Code功能趋同全景解析

June 13, 2026

一、一张时间线图，揭开AI编程圈"双胞胎"的秘密

2026年6月初，开发者 Elie Bakouch 在 X 平台抛出一张令人瞩目的对比图。

这幅信息图绘制了从2025年2月绵延至2026年6月的时间轴，将 Claude Code 与 Codex 的相似功能逐一锚定在发布时间坐标上。橙色标记归属 Claude Code，蓝色则代表 Codex。

每一行条目都是双方共享或高度近似的功能：/goal指令、子智能体系统、上下文压缩机制、沙箱环境、技能库模块、dreaming 记忆引擎……

这张功能图谱在开发者社区激起层层涟漪，因为数据结论犀利到令人无法忽视：

统计维度	数据
共有相似功能	24项
Claude Code 先发	18项
Codex 先发	4项
存在争议	2项

18:4的悬殊比例。 橙色（Claude Code）几乎覆盖了时间轴的前半段版面。

Elie 并非凭印象论断。他交叉核验了 npm 发布记录、GitHub Release 日志和官方技术博客，逐条考据了每一项功能的首次亮相时间。

来源：Elie Bakouch 的 X 帖子及 GitHub Gist，36氪/新智元 2026-06-08 报道

二、11天——新功能的领先窗口正以"天"为单位消失

18:4 的统计已足够触目惊心。但更让人心头一紧的是追赶加速度。

Codex 率先推出的4项功能

身为后来者的 Codex（Claude Code 2025年2月推出，Codex 编程智能体同年5月才亮相），同样拥有原创时刻：

功能	Codex 先发时间	Claude Code 追平时间	追平耗时
内置沙箱	Codex 早期优势	Claude Code 后续跟进	—
云端异步智能体	Codex 率先推出	—	仍处于领先
目标模式（Goal mode）	Codex 首发	Claude Code 实现对齐	11天
多智能体并行	Codex 先发	Claude Code 跟进实现	11天

发现了没？区区11天。

Codex 率先发布的4项功能中，至少有2项被 Claude Code 在约11天内迎头赶上。在软件开发领域，11天甚至塞不满一个标准的 sprint 周期。

注：追平天数依据 Elie Bakouch 的原始时间线对照得出（交叉 npm 发布日志、GitHub Release 和官方博客），精确天数以原始数据为准。

Claude Code 率先建立的18项功能

另一端，Codex 追赶 Claude Code 的时间线则长得多。Claude Code 凭借约80天的先发时间窗，在这18项功能上展开了密集迭代的节奏：

• 无界面脚本化模式（headless）
• 模型上下文协议（MCP）
• 自定义斜杠命令系统
• 上下文压缩引擎
• 子智能体（subagents）
• 生命周期钩子（hooks）
• 技能库体系（skills）
• ……以及更多模块

Claude Code 用约一年时间筑起了这18项功能的先发壁垒。而 Codex 项项紧追，追得极快，但差距依然可辨。

来源：36氪/新智元 2026-06-08，Elie Bakouch 对比数据

三、连命名都撞了：一个字符级的对标现象

功能相近尚且可以理解。问题在于——连命名都如出一辙。

撞名之一：`/btw` 命令

Claude Code 内置的 /btw 命令，用于侧边栏提问——不打断主工作流，随时插入一句咨询。

Codex 的对等命令名为 /side，功能几乎完全一致。而社区用户已在提议将 /btw 添加为别名——连命名都想拉平。

撞名之二：SKILL.md 格式

双方不约而同采用 SKILL.md 作为技能系统的文件格式规范。

这套格式最早由 Anthropic 发起，随后开放为行业标准。如今 Claude Code 支持、Codex 支持、Cursor 支持、Gemini CLI 支持，连 VS Code 也已兼容。

一场跨平台的标准化浪潮——这意味着你编写的一份技能文件，可在所有主流 AI 编程工具中通用。

撞名之三：Dreaming 记忆机制

Anthropic 为 Claude Managed Agents 打造了一项名为 dreaming 的机制——能回溯历史会话、发现规律、自我优化。2026年5月初正式公开。

同年6月初，OpenAI 也为 ChatGPT 部署了同名的 dreaming 记忆系统。

虽然这两个 dreaming 在技术实现上并非同一概念——Anthropic 的植根于托管智能体平台，OpenAI 的扎根于 ChatGPT 记忆系统——但名称撞了，理念也撞了。

撞名之四：Goal 模式

Claude Code 的 /goal 命令：设定一项完成条件，它会跨多轮持续工作，每完成一轮由一个小模型裁决条件是否达标，未达成则继续迭代。

Codex 的 Goal mode：给定一个持久目标，Codex 朝这个方向一轮轮推进下去，几小时甚至数天无需人工干预。

同一套机制，两家各自实现了一份。

四、不是抄袭，是形态收敛

读到这里，你或许会疑惑：是否有一方在模仿另一方？

真相远比这个猜想复杂。

为什么会"撞脸"？

AI 编程智能体这个产品形态，正在不可逆转地收敛成一个确定的轮廓。

你可以将 AI 编程智能体想象成一架航空器。不管谁制造，最终都会有驾驶舱、推进系统、导航设备、安全防护——不是模仿的结果，而是因为这就是"航空器"的本质形态。

对于 AI 编程工具而言，这些"驾驶舱"和"推进系统"表现为：

必然模块	必然性的根源
长任务/目标模式	开发者需要AI持续运行数小时而无需值守
子智能体	复杂任务必须拆解并行处理
上下文压缩	长会话无法回避上下文精简
沙箱隔离	安全基线要求代码在隔离环境中运行
插件/技能生态	不可能内置全部能力，必须对外开放
记忆系统	长期使用必然依赖经验积累
自定义命令	开发者必须能定制个人工作流

不管谁来做 AI 编程智能体，最终都会具备这一整套能力体系。

Elie 自己的结论

Elie 抛出那张时间线，本意是想为两方划出高低。但他最终得出了一个更耐人寻味的结论：

功能矩阵本身已不再构成护城河。真正的分水岭，已从"有没有这个功能"升维到"这个功能究竟做成什么样"。

同一项功能——

• 谁的响应延迟更低？
• 长任务的成功率更高？
• 自动压缩更干净？
• 权限控制更安全？
• 运行成本更低？

这些才是真正的较量维度。

五、起了个大早，赶了个晚集：Codex 的先发优势之谜

这里有一段被多数人忽略的历史暗线。

“Codex"这个名字并非2025年才诞生。

OpenAI 早在 2021年 就发布了 Codex 模型——通过自然语言生成代码。这是 OpenAI 的战略级产品之一，比 GitHub Copilot 的底层技术更早露面。

但 Elie 对比的并非2021年的 Codex 模型，而是2025年才登场的 Codex 编程智能体。

时间轴揭示如下：

时间	事件
2021年	OpenAI 发布 Codex 模型（专注代码生成）
2025年2月	Anthropic 推出 Claude Code（终端编程智能体）
2025年5月	OpenAI 推出 Codex 编程智能体
2026年2月	Codex 桌面客户端上线
2026年6月	Codex 宣布并入 ChatGPT

OpenAI 明明在 AI 编程领域抢了先机（2021年），却将编程 Agent 的先发优势拱手让给了 Claude Code（2025年）。

旧 Codex 证明了"模型能写代码”，Claude Code 则率先把这件事打磨成开发者愿意每日使用的智能体产品。

这是一个典型的"创新者困境"——你拥有核心技术，却未能将其转化为正确的产品形态。等你回过神来，对手已经跑出去80天了。

六、用户数据：谁在占据上风？

功能对比只是表层现象，用户数据才能映照真实格局。

使用量变迁轨迹

时间节点	Codex 使用量 / Claude Code	来源
2025年9月	Codex 仅为 Claude Code 的 5%	WIRED
2026年1月	Codex 升至 Claude Code 的 ~40%	WIRED
2026年4月30日	Codex npm 下载量反超 Claude Code	第三方统计
2026年5月（单周）	Codex 8610万次 vs Claude Code 720万次	DoNews

两个维度的"赢"

但这里隐藏着一个关键界定：怎样定义"赢"？

按"每周有多少人打开"——Codex 在实现反超：

指标	Codex	Claude Code	来源
周活跃用户	500万+	~200万（估算）	OpenAI/第三方
npm 月下载量（近30天）	~1400万	~4630万	第三方统计

注：Codex 在5月初曾出现单周爆发式增长（单周8610万次下载），但月度 npm 下载量因统计口径差异（仅计 CLI 包）与周活口径不同，两者不完全可比。

注意观察——周活 Codex 反超了，但 npm 下载量 Claude Code 依然是 Codex 的 3倍有余。

原因何在？

因为 Codex 的500万里，非开发者占比20%，且增速达到开发者的3倍。这是将"编程工具"扩展成"办公平台"后的数字效应。

在更纯粹的开发者侧，Claude Code 仍然占据上风。

一句话概括：论"每周打开频次"，Codex 已实现反超；论"开发者的使用深度"，Claude Code 仍保持领先。

七、开发者"倒戈"潮：可靠性成为决胜变量

值得 Anthropic 警惕的，是部分重量级开发者的阵营转移。

Simon Last（Notion 联合创始人）

WIRED 援引了他的表述：

他和核心工程师在 GPT-5.2 前后转向了 Codex，理由是可靠性。
“Claude Code 会对我撒谎。"——Simon Last，WIRED 采访

Peter Steinberger（OpenClaw 创建者）

2025年底，他基于 Codex CLI 构建了开源项目 OpenClaw，自称常在 3x3 终端网格里并行运行 3 到 8 个 Codex 实例。2026年2月——他本人加入了 OpenAI。

他讲述自己常在 3x3 终端网格里并行启动 3 到 8 个 Codex 实例。

为什么可靠性成为决胜手牌？

这些"阵营转换"案例揭示了一股趋势：

当功能列表日趋一致时，开发者选择工具的准则，从"谁功能更多"迁移到"谁更值得信赖”。

• Codex 的优势：稳定性、长任务不中断、多端同步能力
• Claude Code 的优势：代码质量更深、理解上下文更准确、推理更细致

Reddit 上一位开发者的评论切中要害：

“Claude 像一位靠谱的资深同事，会自主做端到端测试，遇到报错主动帮你排查环境。Codex 更像一个技术精湛的外包极客，代码能跑但架构风格粗犷。”

八、两种打法的底层分野

虽然功能在趋同，但两家的底层逻辑截然不同。

Claude Code：终端里的自主工程师

路线：先在命令行里将开发者工作流吃深吃透  
      → 再用 hooks、子智能体、技能、插件向外延伸  
      → 终极形态：开发者的操作系统

Claude Code 的基因深植终端。它从命令行出发，先深耕开发者工作流——理解代码库、跨文件重构、长会话推理。然后通过 hooks、subagents、skills 向外生长。

Codex：多端协同工作台

路线：把命令行 + IDE + 桌面App + 手机远程 + 云端任务融成一体  
      → 再透过角色插件向非开发者渗透  
      → 终极形态：全员 AI 办公平台（即将并入 ChatGPT）

Codex 的基因是平台化。它从云端起步，覆盖命令行、IDE、桌面应用、手机远程控制，现在还要添上 ChatGPT 的9亿用户入口。

一张图揭示差异

维度	Claude Code	Codex
起点	终端命令行	云端智能体
核心用户	开发者	开发者 + 非开发者
扩展方向	从深到广	从广到深
强项	代码质量、深度推理	稳定性、多端同步
弱项	额度消耗快、稳定性争议	代码深度不足
生态打法	hooks + skills + MCP	插件 + Sites + ChatGPT 合并
终极目标	开发者的操作系统	全员的 AI 办公平台

虽然打法各异，两者的目标却意外交汇：都不甘心只当 IDE 里的一个插件，都想成为开发者每天打开的第一个入口，成为个人和企业的操作系统。

九、差异化窗口正在急速关闭

Elie 那张时间线映照出最冷酷的现实：

AI 编程智能体的差异化窗口，正在以肉眼可见的速度关闭。

2025年初，两家差距悬殊——Claude Code 拥有18项独占功能，Codex 才刚刚起步。

2026年中，两家的功能矩阵已高度重叠。任一新功能发布，对手的追赶速度精确到以天计算。

这预示着什么？

对开发者的影响

好消息：无论选哪个，功能都足够完整。你不会因缺少某项功能而受限。

坏消息：选择变得更难了。不再是"谁功能更多"，而是"谁的体验更佳"——这种判断需要你亲自上手、深度使用才能沉淀出来。

对行业的影响

功能趋同意味着竞争已跨入新阶段：

阶段	竞争焦点	时间
第一阶段	谁的模型更强	2024-2025
第二阶段	谁的功能更多	2025-2026
第三阶段	谁的体验更优	2026-

第三阶段的决胜变量：

• 可靠性：长任务不崩溃、不撒谎、不捏造
• 成本效率：同等质量下谁更经济
• 生态深度：插件、技能、第三方集成的丰富度
• 用户基数：Codex 背靠 ChatGPT 9亿用户，Claude Code 依靠开发者口碑

十、给普通人的建议

如果你正在选择第一个 AI 编程工具

两个都体验一下。

• 先试 Codex：上手更平滑，多端支持好，非开发者友好度高
• 再试 Claude Code：代码质量更深，推理更细微，适合重度开发者

如果你已经在使用其中一个

无需仓促切换。 功能趋同意味着你不会因为选错了而承受大损失。真正重要的是深度使用——用得越多，工具越理解你的习惯。

如果你是企业管理者

关注两件事：

1. Codex 即将并入 ChatGPT：如果你的公司已在用 ChatGPT Enterprise，Codex 能力会自动解锁
1. Claude Code 在开发者社区的口碑更扎实：如果你的团队以开发者为主体，Claude Code 可能是更稳健的选择

写在最后：长得一样，不意味着灵魂相同

Codex 和 Claude Code 越来越像——24项功能对齐，连命名都撞了。

但这绝不意味着两者没有差别。

就像两款驾具都有动力系统、操控装置、安全配置、导航模块——功能清单一模一样，但驾驶起来的感受截然不同。

Claude Code 更像一个深度思考的工程师：它理解你的代码库、找到隐藏的依赖、做出更审慎的决策。

Codex 更像一个全能型助手：它响应更快、多端同步、稳定性好、还能帮你搭建网站、制作演示、撰写报告。

功能在趋同，但灵魂不一样。

而这场贴身肉搏，才刚刚启幕。

参考来源：
• 36氪/新智元：Codex 撞脸 Claude Code，新功能只领先11天（2026-06-08）
• 知乎：炸裂！Claude Code 和 Codex 撞脸了，24项功能几乎一模一样（2026-06-08）
• CSDN：24项功能18:4！我用真实数据扒了 Claude Code 和 Codex 的底裤（2026-06-08）
• 搜狐：Claude Code 与 Codex 功能趋同，差异化竞争成关键（2026-06-08）
• Elie Bakouch X 帖子及 GitHub Gist（2026-06-07）
• WIRED：Codex vs Claude Code 用户增长报道（2026）
• DoNews：Codex npm 下载量达 Claude Code 12倍（2026-05）
• 知乎：Codex 五月下载量反超 Claude Code 大逆转原因分析（2026-05）
• OpenAI 官方：Codex 周活500万+公告（2026-06-02）