Codex 重磅更新全解读:Goal 模式、Chrome 扩展与子代理实战指南
Codex 近期的迭代速度超出了我的预期。他们的负责人曾透露,每周四会推出一次大版本更新,每周五则补充一些零碎的优化。最近两三周,团队确实兑现了这个承诺。
相较于之前,现在 Codex 已经集成了大量新能力:Chrome 扩展、Appshots、Goal 模式、自动审查、一键迁移、权限系统……有些功能刚亮相时我总觉得“这有什么用”,但在真正上手后却再也离不开了。
在深入各个功能之前,先简单厘清 Codex 的版本体系,因为很多新用户容易混淆。
Codex 目前主要提供四个版本:
| 版本 | 说明 | 平台 |
|---|---|---|
| Codex 桌面应用 | 功能最完整的版本,支持多线程并行、Worktree、自动化、Git 集成等 | Windows、macOS |
| Codex CLI | 命令行版本,在终端中运行,适合偏爱命令行的开发者 | Windows、macOS、Linux |
| Codex IDE 扩展 | 嵌入 VS Code / JetBrains 编辑器内,与编辑器深度整合 | Windows、macOS、Linux |
| Codex Web | 网页版,无需任何安装即可使用 | 浏览器 |
本文介绍的新功能大部分适用于桌面应用和 CLI,如果某个功能仅限于某一版本,我会单独注明。另外,我本人是 Windows 用户,若出现仅支持 Mac 而 Windows 暂不可用的功能,也会特别标明。
下面,我们来看看那些我认为真正让 Codex 起飞的更新要点。
Goal 模式:为 Codex 设定清晰的终点线
平台支持:桌面应用、CLI、IDE 扩展(Windows / macOS 通用)
Goal 模式近期关注度极高,连 Claude Code 也跟进了类似设计。
常规对话中,你说一句,它做一步,完成后再等你给出下一道指令。Goal 模式则截然不同——你只需指定一个目标,它自行判断是否完成,并持续向前推进,直到终点被触及。
适合的使用场景
这种模式尤其适合“你清楚想要什么结果,但中间需要经历许多未知步骤”的任务。典型例子包括:
- 将一个 JavaScript 项目迁移到 TypeScript,且要求严格模式编译通过才算完成
- 把首页加载速度优化至 1 秒以内
- 为整个代码库补齐单元测试,覆盖率达到 80%
这些任务都拥有一个明确的“完成”定义,但实现过程往往需要大量操作。
如何启用 Goal 模式
Goal 模式并非默认开启,需手动激活。有两种方法,你可以根据习惯选择:
方式一:修改配置文件(一劳永逸)
找到 Codex 的配置文件 config.toml,在 Windows 上通常位于 C:\Users\你的用户名\.codex\config.toml,添加以下两行:
[features]
goals = true
保存后重启 Codex 即可生效。
方式二:通过 CLI 命令开启
在终端中执行:
codex features enable goals
你也可以直接让 Codex 代为执行这条命令。
启用后,在桌面应用或 CLI 的输入框中键入 /goal,后跟一个空格以及你的目标描述即可。例如:
/goal 把这个项目从 JavaScript 迁移到 TypeScript,严格模式编译通过

出现类似上图的反馈,就表示 Goal 模式已成功激活。
怎样写出优质的目标
核心原则只有一条:让 Codex 能够自行判断是否成功。
糟糕的目标:“优化一下这个项目”。什么叫“优化”?Codex 无法量化。
好的目标:“将首页可交互时间降至 1 秒以下,并使用 Lighthouse 跑分验证。” Codex 可以自己测量。
同样:“把所有 API 接口从 REST 迁移到 GraphQL,现有测试全部通过。” 测试通过就是终点线。
如果目标难以量化,可以先用 /plan 让 Codex 帮你梳理,再切换到 Goal 模式。它会先与你沟通清晰,再开始执行。
实际体验
Goal 模式最令人愉悦的一点是:设定好目标后你完全可以去做别的事。Codex 会持续推动进度,中途遇到问题也会设法自行解决。
一个定义良好的目标可能运行数小时,等你回来时,要么任务已经完成,要么它会给你一份清晰的进度报告。
Chrome 扩展:让你的浏览器成为 Codex 的延伸
平台支持:桌面应用(Windows / macOS 通用)
这个功能针对一个非常实际的痛点:很多网站需要登录才能操作,而 Codex 自带的浏览器里并没有你的登录态。
Chrome 扩展让 Codex 能够直接使用你 Chrome 浏览器中已登录的账号。无论是 Salesforce、LinkedIn、Gmail 还是内部工具,只要你的 Chrome 能访问,Codex 就能代为操作。
注意:该功能需要你电脑上安装有 Chrome 浏览器,并通过 Codex 桌面应用的插件系统支撑,CLI 和 IDE 扩展无法使用。
设置步骤
- 打开 Codex 桌面应用,点击左侧栏的 Plugins(插件)
- 找到 Chrome 插件并点击添加
- 按照提示安装 Chrome 扩展(会跳转到 Chrome 应用商店)
- 在 Chrome 中确认扩展状态显示为 Connected
典型使用场景
最常出现的需求是“帮我查一下 XXX”。例如:
@Chrome 打开 Salesforce,查看 ABC 公司的最新订单状态@Chrome 去 LinkedIn 找一下这位候选人的资料@Chrome 打开内部运维平台,检查今天是否有告警
过去这类操作需要你手动切换浏览器、登录、查找,现在 Codex 可以替你完成。
安全控制
默认情况下,Codex 每访问一个新网站都会向你确认。你可以选择“允许本次”、“始终允许该网站”或“拒绝”。
如果觉得频繁询问比较麻烦,可以在设置里将常用网站加入允许列表。但建议对敏感网站(银行、支付、内部系统)保持询问状态。
Appshots:截图即上下文,快速传达视觉信息
平台支持:仅 macOS 桌面应用。Windows 用户暂不可用。
Appshots 的含义是:你可以把当前在 Mac 应用中看到的任意窗口截图直接发给 Codex,它就能理解其中的内容。
这个功能限定 macOS 的原因是它依赖于 macOS 的屏幕录制与辅助功能 API,Windows 上暂无对应的系统接口。官方目前也未公布何时会支持 Windows。
使用场景
假设你正浏览一份 API 文档页面,想让 Codex 写一个调用该 API 的脚本。以前你需要复制 URL 发给 Codex,它还得自己去加载。现在只需双击 Command 键,截图即被传过去。
更常见的场景还有:
- 遇到一个报错截图,直接丢给 Codex 分析
- 设计师发来一张 Figma 截图,让 Codex 据此编写代码
- 邮件里有需求描述,截图让 Codex 整理成任务列表
- 日历中有个会议,截图让 Codex 帮你准备议题
如何截图
双击 Command 键,或者你可以在 Codex 设置 → Appshots 中自定义快捷键。
截图会自动发送到当前的 Codex 线程。如果你最近 60 秒内使用过 Codex,会附加到当前对话;否则将开启一个新线程。
权限设置
首次使用时会要求授予屏幕录制和辅助功能权限,同意即可。
注意:截图内容将被发送给 Codex,敏感信息请慎用。
Windows 用户的替代方案
尽管 Appshots 不可用,但你仍然可以手动截图,再粘贴到 Codex 对话里。Codex 桌面应用支持图片输入(拖拽或 Ctrl+V 粘贴),效果类似,只是缺少一键截取的便利性。
一键迁移:无缝从其他 AI 助手切换至 Codex
平台支持:桌面应用(Windows / macOS 通用)
如果你之前用过 Cursor、Claude Code 或其他 AI 编程助手,现在想切换到 Codex,这个功能可以节省大量精力。
支持迁移的内容
| 原来的 | 迁移后 |
|---|---|
| 指令文件 | AGENTS.md |
| settings.json | config.toml |
| Skills | Codex skills |
| 最近 30 天会话 | Codex 线程和项目 |
| MCP 配置 | Codex MCP 配置 |
| Hooks | Codex hooks |
| 斜杠命令 | Codex skills |
| 子代理 | Codex agents |
操作流程
打开 Codex 桌面应用 → 设置 → 常规**→ 从其他 AI 应用导入工作内容** → 点击 导入。

它会扫描你的用户级和项目级配置,能够直接迁移的内容会自动搬过去,剩余部分则会开启一个新线程帮你处理。
迁移后需检查的关键点
重点验证:
- 导入的 Skills 和 Agents 中的权限设置
- MCP 服务器的认证方式
- Hooks 在 Codex 中的行为是否一致
- 提示模板中的变量替换是否正确
权限系统:细粒度掌控代理行为
平台支持:桌面应用、CLI、IDE 扩展(Windows / macOS 通用)
Codex 的权限系统经历了一次较大升级。现在你可以非常精细地控制代理能做什么、不能做什么。

三种沙箱模式
| 模式 | 说明 |
|---|---|
| 默认权限 | 代理只能查看,不能修改 |
| 自动审核 | 可以修改工作区内的文件 |
| 完全访问权限 | 可修改更多目录(需额外配置) |
审批策略
| 策略 | 说明 |
|---|---|
| 从不 | 全部自动放行 |
| 按需 | 仅当代理请求时才询问(默认) |
| 总是 | 每一个操作都向用户确认 |
使用建议
大多数用户的默认配置已经足够。如果你发现 Codex 频繁询问是否执行某个命令,可以将该命令加入允许列表。如果它修改了不该修改的文件,可以用 protected_paths 把相应路径保护起来。
团队项目中,建议在 AGENTS.md 里统一规定权限策略,避免各自配置导致混乱。
子代理:让 Codex 自主分工、并行处理
平台支持:桌面应用、CLI、IDE 扩展(Windows / macOS 通用)
子代理主要解决两大痛点:上下文膨胀 和 任务并行。
上下文膨胀是怎么回事?当你在主线程里让 Codex 搜索代码、跑测试、读日志,这些中间输出会迅速挤占上下文窗口。窗口一满,模型可能忘记最初的需求,回答质量就会下降。子代理的策略是:主线程只负责任务分配和结果汇总,中间的脏活累活交给子代理完成,最后只将结论返回主线程。
任务并行更好理解。一个代理检查安全问题,一个检查测试,一个检查代码质量,三个同时跑,效率远高于串行执行。
内置代理
Codex 内置了三个代理,无需创建任何文件即可直接使用:
| 代理 | 用途 |
|---|---|
default | 通用后备,几乎能做任何事 |
worker | 执行型代理,负责实施和修复 |
explorer | 探索型代理,大量读取代码库 |
这些代理是 Codex 程序内置的,你看不到文件也无需配置。
如何触发子代理
关键点:Codex 不会自动启动子代理,你必须明确说明需要使用。
直接在提示词中告诉 Codex 即可,例如:
单个子代理:
用一个子代理帮我探索这个项目的目录结构,搞清楚主要模块分别干什么。
多个并行:
启动两个子代理并行工作,一个检查安全问题,另一个检查测试覆盖,都完成后汇总结果。
官方推荐的分工写法:
启动子代理,每个点分配一个代理,等全部完成后汇总:
1. 安全问题
2. 代码质量
3. Bug
4. 测试稳定性
你不需要记住具体的代理名称,只要使用以下关键词,Codex 就会明白你的意图:
- “启动一个子代理” / “spawn an agent”
- “并行委托” / “delegate in parallel”
- “每个点用一个代理” / “one agent per point”
管理子代理
在 CLI 中输入 /agent 可以查看当前活动的子代理线程,还可以在它们之间切换。你也可以直接告诉 Codex “停止那个代理” 或 “关闭已完成的代理线程”。
自定义代理:精确控制代理行为
内置代理虽然好用,但如果你希望代理拥有特定的行为、使用特定的模型、拥有特定的权限,就要通过自定义代理来实现。
自定义代理实际上就是一个 .toml 配置文件,存放在指定目录:
| 位置 | 作用范围 |
|---|---|
~/.codex/agents/xxx.toml | 全局,所有项目可用 |
.codex/agents/xxx.toml | 项目级,仅对当前项目生效 |
Windows 系统上 ~ 即 C:\Users\你的用户名\。
文件格式
每个 .toml 文件定义一个代理,必须包含三个字段:
name = "reviewer"
description = "PR 审查代理,专注正确性、安全性和测试覆盖。"
developer_instructions = """像代码主人一样审查。优先关注正确性、安全行为回归和缺失的测试覆盖。给出具体发现,能给复现步骤就给,别只评论代码风格。
可选字段:
model = "gpt-5.4" # 指定使用哪个模型
model_reasoning_effort = "high" # 推理强度:low / medium / high
sandbox_mode = "read-only" # 沙箱模式:read-only / workspace-write / full-write
nickname_candidates = ["Atlas", "Delta"] # UI 显示用的昵称候选
不写可选字段时,代理会继承当前会话的默认设置。
实战示例:三个代理协作审查 PR
在项目根目录下创建 .codex/agents/ 文件夹,并放入三个文件:
.codex/agents/pr-explorer.toml — 探索代码路径:
name = "pr_explorer"
description = "只读代码探索器,用于收集证据。"
model = "gpt-5.4-mini"
model_reasoning_effort = "medium"
sandbox_mode = "read-only"
developer_instructions = """保持探索模式。追踪实际执行路径,引用文件和符号,除非父代理要求,不要提出修复建议。优先快速搜索和精准读取,避免大范围扫描。
.codex/agents/reviewer.toml — 审查风险:
name = "reviewer"
description = "PR 审查代理,专注正确性、安全性和缺失测试。"
model = "gpt-5.4"
model_reasoning_effort = "high"
sandbox_mode = "read-only"
developer_instructions = """像代码主人一样审查。优先关注正确性、安全行为回归和缺失的测试覆盖。给出具体发现,能给复现步骤就给,别只评论代码风格。
.codex/agents/docs-researcher.toml — 查文档验证 API:
name = "docs_researcher"
description = "文档专家,使用 MCP 服务器验证 API 和框架行为。"
model = "gpt-5.4-mini"
model_reasoning_effort = "medium"
sandbox_mode = "read-only"
developer_instructions = """使用文档 MCP 服务器确认 API、选项和版本特定行为。返回简洁的答案,附带链接或精确引用。不要修改代码。
配置完成后,可以在 Codex 中这样使用:
对照主分支检查此分支。让 pr_explorer 映射受影响的代码路径,reviewer 发现真正的风险,docs_researcher 验证补丁所依赖的框架 API。
Codex 会同时启动三个代理并行工作,最后汇总结果。
全局配置
在 config.toml 中可以对子代理的并发和嵌套进行控制:
[agents]
max_threads = 6 # 最多同时运行的代理数,默认为 6
max_depth = 1 # 嵌套深度,默认为 1(只允许一层子代理)
一般来说默认值已经足够,无需修改。
写在最后
回看这些新功能,能发现一个共同的趋势:Codex 正从“你告诉它怎么做”转向“你告诉它要什么结果”。
Goal 模式让你定义终点而非步骤;自动审查让 AI 为你做安全判断;Chrome 扩展和 Appshots 让它能获取更多真实世界的上下文;子代理让它能自己组织分工。
过去使用 AI 编程工具,你更像一位“指挥官”——每一步都需要下达指令。现在,你越来越像一个“委托人”——把目标和边界讲清楚,它便能自己找路到达。
当然,“委托”不代表“放任”。权限系统、审查机制、熔断器,都是在为你兜底。好的工具不是让你完全放手,而是让你在应当放手的地方放手,在必须把关的地方把关。
这才是这些新功能真正想告诉你的。