Codex 重磅更新全解读：Goal 模式、Chrome 扩展与子代理实战指南

June 6, 2026

Codex 近期的迭代速度超出了我的预期。他们的负责人曾透露，每周四会推出一次大版本更新，每周五则补充一些零碎的优化。最近两三周，团队确实兑现了这个承诺。

相较于之前，现在 Codex 已经集成了大量新能力：Chrome 扩展、Appshots、Goal 模式、自动审查、一键迁移、权限系统……有些功能刚亮相时我总觉得“这有什么用”，但在真正上手后却再也离不开了。

在深入各个功能之前，先简单厘清 Codex 的版本体系，因为很多新用户容易混淆。

Codex 目前主要提供四个版本：

版本	说明	平台
Codex 桌面应用	功能最完整的版本，支持多线程并行、Worktree、自动化、Git 集成等	Windows、macOS
Codex CLI	命令行版本，在终端中运行，适合偏爱命令行的开发者	Windows、macOS、Linux
Codex IDE 扩展	嵌入 VS Code / JetBrains 编辑器内，与编辑器深度整合	Windows、macOS、Linux
Codex Web	网页版，无需任何安装即可使用	浏览器

本文介绍的新功能大部分适用于桌面应用和 CLI，如果某个功能仅限于某一版本，我会单独注明。另外，我本人是 Windows 用户，若出现仅支持 Mac 而 Windows 暂不可用的功能，也会特别标明。

下面，我们来看看那些我认为真正让 Codex 起飞的更新要点。

Goal 模式：为 Codex 设定清晰的终点线

平台支持：桌面应用、CLI、IDE 扩展（Windows / macOS 通用）

Goal 模式近期关注度极高，连 Claude Code 也跟进了类似设计。

常规对话中，你说一句，它做一步，完成后再等你给出下一道指令。Goal 模式则截然不同——你只需指定一个目标，它自行判断是否完成，并持续向前推进，直到终点被触及。

适合的使用场景

这种模式尤其适合“你清楚想要什么结果，但中间需要经历许多未知步骤”的任务。典型例子包括：

将一个 JavaScript 项目迁移到 TypeScript，且要求严格模式编译通过才算完成
把首页加载速度优化至 1 秒以内
为整个代码库补齐单元测试，覆盖率达到 80%

这些任务都拥有一个明确的“完成”定义，但实现过程往往需要大量操作。

如何启用 Goal 模式

Goal 模式并非默认开启，需手动激活。有两种方法，你可以根据习惯选择：

方式一：修改配置文件（一劳永逸）

找到 Codex 的配置文件 config.toml，在 Windows 上通常位于 C:\Users\你的用户名\.codex\config.toml，添加以下两行：

[features]
goals = true

保存后重启 Codex 即可生效。

方式二：通过 CLI 命令开启

在终端中执行：

codex features enable goals

你也可以直接让 Codex 代为执行这条命令。

启用后，在桌面应用或 CLI 的输入框中键入 /goal，后跟一个空格以及你的目标描述即可。例如：

/goal 把这个项目从 JavaScript 迁移到 TypeScript，严格模式编译通过

出现类似上图的反馈，就表示 Goal 模式已成功激活。

怎样写出优质的目标

核心原则只有一条：让 Codex 能够自行判断是否成功。

糟糕的目标：“优化一下这个项目”。什么叫“优化”？Codex 无法量化。

好的目标：“将首页可交互时间降至 1 秒以下，并使用 Lighthouse 跑分验证。” Codex 可以自己测量。

同样：“把所有 API 接口从 REST 迁移到 GraphQL，现有测试全部通过。” 测试通过就是终点线。

如果目标难以量化，可以先用 /plan 让 Codex 帮你梳理，再切换到 Goal 模式。它会先与你沟通清晰，再开始执行。

实际体验

Goal 模式最令人愉悦的一点是：设定好目标后你完全可以去做别的事。Codex 会持续推动进度，中途遇到问题也会设法自行解决。

一个定义良好的目标可能运行数小时，等你回来时，要么任务已经完成，要么它会给你一份清晰的进度报告。

Chrome 扩展：让你的浏览器成为 Codex 的延伸

平台支持：桌面应用（Windows / macOS 通用）

这个功能针对一个非常实际的痛点：很多网站需要登录才能操作，而 Codex 自带的浏览器里并没有你的登录态。

Chrome 扩展让 Codex 能够直接使用你 Chrome 浏览器中已登录的账号。无论是 Salesforce、LinkedIn、Gmail 还是内部工具，只要你的 Chrome 能访问，Codex 就能代为操作。

注意：该功能需要你电脑上安装有 Chrome 浏览器，并通过 Codex 桌面应用的插件系统支撑，CLI 和 IDE 扩展无法使用。

设置步骤

打开 Codex 桌面应用，点击左侧栏的 Plugins（插件）
找到 Chrome 插件并点击添加
按照提示安装 Chrome 扩展（会跳转到 Chrome 应用商店）
在 Chrome 中确认扩展状态显示为 Connected

典型使用场景

最常出现的需求是“帮我查一下 XXX”。例如：

@Chrome 打开 Salesforce，查看 ABC 公司的最新订单状态
@Chrome 去 LinkedIn 找一下这位候选人的资料
@Chrome 打开内部运维平台，检查今天是否有告警

过去这类操作需要你手动切换浏览器、登录、查找，现在 Codex 可以替你完成。

安全控制

默认情况下，Codex 每访问一个新网站都会向你确认。你可以选择“允许本次”、“始终允许该网站”或“拒绝”。

如果觉得频繁询问比较麻烦，可以在设置里将常用网站加入允许列表。但建议对敏感网站（银行、支付、内部系统）保持询问状态。

Appshots：截图即上下文，快速传达视觉信息

平台支持：仅 macOS 桌面应用。Windows 用户暂不可用。

Appshots 的含义是：你可以把当前在 Mac 应用中看到的任意窗口截图直接发给 Codex，它就能理解其中的内容。

这个功能限定 macOS 的原因是它依赖于 macOS 的屏幕录制与辅助功能 API，Windows 上暂无对应的系统接口。官方目前也未公布何时会支持 Windows。

使用场景

假设你正浏览一份 API 文档页面，想让 Codex 写一个调用该 API 的脚本。以前你需要复制 URL 发给 Codex，它还得自己去加载。现在只需双击 Command 键，截图即被传过去。

更常见的场景还有：

遇到一个报错截图，直接丢给 Codex 分析
设计师发来一张 Figma 截图，让 Codex 据此编写代码
邮件里有需求描述，截图让 Codex 整理成任务列表
日历中有个会议，截图让 Codex 帮你准备议题

如何截图

双击 Command 键，或者你可以在 Codex 设置 → Appshots 中自定义快捷键。

截图会自动发送到当前的 Codex 线程。如果你最近 60 秒内使用过 Codex，会附加到当前对话；否则将开启一个新线程。

权限设置

首次使用时会要求授予屏幕录制和辅助功能权限，同意即可。

注意：截图内容将被发送给 Codex，敏感信息请慎用。

Windows 用户的替代方案

尽管 Appshots 不可用，但你仍然可以手动截图，再粘贴到 Codex 对话里。Codex 桌面应用支持图片输入（拖拽或 Ctrl+V 粘贴），效果类似，只是缺少一键截取的便利性。

一键迁移：无缝从其他 AI 助手切换至 Codex

平台支持：桌面应用（Windows / macOS 通用）

如果你之前用过 Cursor、Claude Code 或其他 AI 编程助手，现在想切换到 Codex，这个功能可以节省大量精力。

支持迁移的内容

原来的	迁移后
指令文件	AGENTS.md
settings.json	config.toml
Skills	Codex skills
最近 30 天会话	Codex 线程和项目
MCP 配置	Codex MCP 配置
Hooks	Codex hooks
斜杠命令	Codex skills
子代理	Codex agents

操作流程

打开 Codex 桌面应用 → 设置 → 常规**→ 从其他 AI 应用导入工作内容** → 点击导入。

它会扫描你的用户级和项目级配置，能够直接迁移的内容会自动搬过去，剩余部分则会开启一个新线程帮你处理。

迁移后需检查的关键点

重点验证：

导入的 Skills 和 Agents 中的权限设置
MCP 服务器的认证方式
Hooks 在 Codex 中的行为是否一致
提示模板中的变量替换是否正确

权限系统：细粒度掌控代理行为

平台支持：桌面应用、CLI、IDE 扩展（Windows / macOS 通用）

Codex 的权限系统经历了一次较大升级。现在你可以非常精细地控制代理能做什么、不能做什么。

三种沙箱模式

模式	说明
默认权限	代理只能查看，不能修改
自动审核	可以修改工作区内的文件
完全访问权限	可修改更多目录（需额外配置）

审批策略

策略	说明
从不	全部自动放行
按需	仅当代理请求时才询问（默认）
总是	每一个操作都向用户确认

使用建议

大多数用户的默认配置已经足够。如果你发现 Codex 频繁询问是否执行某个命令，可以将该命令加入允许列表。如果它修改了不该修改的文件，可以用 protected_paths 把相应路径保护起来。

团队项目中，建议在 AGENTS.md 里统一规定权限策略，避免各自配置导致混乱。

子代理：让 Codex 自主分工、并行处理

平台支持：桌面应用、CLI、IDE 扩展（Windows / macOS 通用）

子代理主要解决两大痛点：上下文膨胀 和 任务并行。

上下文膨胀是怎么回事？当你在主线程里让 Codex 搜索代码、跑测试、读日志，这些中间输出会迅速挤占上下文窗口。窗口一满，模型可能忘记最初的需求，回答质量就会下降。子代理的策略是：主线程只负责任务分配和结果汇总，中间的脏活累活交给子代理完成，最后只将结论返回主线程。

任务并行更好理解。一个代理检查安全问题，一个检查测试，一个检查代码质量，三个同时跑，效率远高于串行执行。

内置代理

Codex 内置了三个代理，无需创建任何文件即可直接使用：

代理	用途
`default`	通用后备，几乎能做任何事
`worker`	执行型代理，负责实施和修复
`explorer`	探索型代理，大量读取代码库

这些代理是 Codex 程序内置的，你看不到文件也无需配置。

如何触发子代理

关键点：Codex 不会自动启动子代理，你必须明确说明需要使用。

直接在提示词中告诉 Codex 即可，例如：

单个子代理：

用一个子代理帮我探索这个项目的目录结构，搞清楚主要模块分别干什么。

多个并行：

启动两个子代理并行工作，一个检查安全问题，另一个检查测试覆盖，都完成后汇总结果。

官方推荐的分工写法：

启动子代理，每个点分配一个代理，等全部完成后汇总：
1. 安全问题
2. 代码质量
3. Bug
4. 测试稳定性

你不需要记住具体的代理名称，只要使用以下关键词，Codex 就会明白你的意图：

“启动一个子代理” / “spawn an agent”
“并行委托” / “delegate in parallel”
“每个点用一个代理” / “one agent per point”

管理子代理

在 CLI 中输入 /agent 可以查看当前活动的子代理线程，还可以在它们之间切换。你也可以直接告诉 Codex “停止那个代理” 或 “关闭已完成的代理线程”。

自定义代理：精确控制代理行为

内置代理虽然好用，但如果你希望代理拥有特定的行为、使用特定的模型、拥有特定的权限，就要通过自定义代理来实现。

自定义代理实际上就是一个 .toml 配置文件，存放在指定目录：

位置	作用范围
`~/.codex/agents/xxx.toml`	全局，所有项目可用
`.codex/agents/xxx.toml`	项目级，仅对当前项目生效

Windows 系统上 ~ 即 C:\Users\你的用户名\。

文件格式

每个 .toml 文件定义一个代理，必须包含三个字段：

name = "reviewer"
description = "PR 审查代理，专注正确性、安全性和测试覆盖。"
developer_instructions = """像代码主人一样审查。优先关注正确性、安全行为回归和缺失的测试覆盖。给出具体发现，能给复现步骤就给，别只评论代码风格。

可选字段：

model = "gpt-5.4"                 # 指定使用哪个模型
model_reasoning_effort = "high"   # 推理强度：low / medium / high
sandbox_mode = "read-only"        # 沙箱模式：read-only / workspace-write / full-write
nickname_candidates = ["Atlas", "Delta"]  # UI 显示用的昵称候选

不写可选字段时，代理会继承当前会话的默认设置。

实战示例：三个代理协作审查 PR

在项目根目录下创建 .codex/agents/ 文件夹，并放入三个文件：

.codex/agents/pr-explorer.toml — 探索代码路径：

name = "pr_explorer"
description = "只读代码探索器，用于收集证据。"
model = "gpt-5.4-mini"
model_reasoning_effort = "medium"
sandbox_mode = "read-only"
developer_instructions = """保持探索模式。追踪实际执行路径，引用文件和符号，除非父代理要求，不要提出修复建议。优先快速搜索和精准读取，避免大范围扫描。

.codex/agents/reviewer.toml — 审查风险：

name = "reviewer"
description = "PR 审查代理，专注正确性、安全性和缺失测试。"
model = "gpt-5.4"
model_reasoning_effort = "high"
sandbox_mode = "read-only"
developer_instructions = """像代码主人一样审查。优先关注正确性、安全行为回归和缺失的测试覆盖。给出具体发现，能给复现步骤就给，别只评论代码风格。

.codex/agents/docs-researcher.toml — 查文档验证 API：

name = "docs_researcher"
description = "文档专家，使用 MCP 服务器验证 API 和框架行为。"
model = "gpt-5.4-mini"
model_reasoning_effort = "medium"
sandbox_mode = "read-only"
developer_instructions = """使用文档 MCP 服务器确认 API、选项和版本特定行为。返回简洁的答案，附带链接或精确引用。不要修改代码。

配置完成后，可以在 Codex 中这样使用：

对照主分支检查此分支。让 pr_explorer 映射受影响的代码路径，reviewer 发现真正的风险，docs_researcher 验证补丁所依赖的框架 API。

Codex 会同时启动三个代理并行工作，最后汇总结果。

全局配置

在 config.toml 中可以对子代理的并发和嵌套进行控制：

[agents]
max_threads = 6   # 最多同时运行的代理数，默认为 6
max_depth = 1     # 嵌套深度，默认为 1（只允许一层子代理）

一般来说默认值已经足够，无需修改。

写在最后

回看这些新功能，能发现一个共同的趋势：Codex 正从“你告诉它怎么做”转向“你告诉它要什么结果”。

Goal 模式让你定义终点而非步骤；自动审查让 AI 为你做安全判断；Chrome 扩展和 Appshots 让它能获取更多真实世界的上下文；子代理让它能自己组织分工。

过去使用 AI 编程工具，你更像一位“指挥官”——每一步都需要下达指令。现在，你越来越像一个“委托人”——把目标和边界讲清楚，它便能自己找路到达。

当然，“委托”不代表“放任”。权限系统、审查机制、熔断器，都是在为你兜底。好的工具不是让你完全放手，而是让你在应当放手的地方放手，在必须把关的地方把关。

这才是这些新功能真正想告诉你的。