2025年Codex完全上手指南:桌面应用、模型选择、技巧及与Claude Code对比

文章大纲:
第一部分 安装Codex桌面应用
第二部分 模型选择与思考深度配置
第三部分 核心功能详解
第四部分 Codex与Claude Code全方位对比
若你曾用过 Claude Code,那么上手 Codex 将水到渠成。
过去一年,Anthropic 陆续推出了多款令人瞩目的 AI 工具。Claude Code 直接将 Agent 能力带入命令行,能够阅读项目、修改文件、执行指令,构建出真正融入开发流程的智能工作流。随后推出的 Cowork,更将相同的代理逻辑拓展至桌面端,面向更广泛的知识工作者——用户无需描述每一步操作,只需提出目标,AI 便会自动扫描文件、提取信息、整理内容,并将结果回传等候确认。
那么,作为 Anthropic 的竞争对手,OpenAI 拿出的对应产品是什么?答案正是 Codex。
Codex 是 OpenAI 的新一代 AI 编程代理,覆盖桌面应用、Web 端、命令行工具、IDE 插件及 SDK 等多个入口,几乎贯通了从灵感到落地的完整链条。你可以在桌面端直接启动任务,在终端内深度编排,在 IDE 里边编码边调试,也可以将其接入个人的自动化流程中,让它持续处理长任务、并行任务和审查任务。
如果你熟悉 Anthropic 的产品矩阵,可以按以下关系理解两家的对应布局:
| Anthropic | OpenAI |
|---|---|
| Claude Code(命令行,面向开发者) | Codex CLI |
| Cowork(桌面,面向知识工作者) | Codex 桌面版 APP |
| Claude.ai 网页版 | chatgpt 网页版 |
| Claude IDE 插件 | Codex IDE 插件 |
当然,二者并非简单的镜像复制,它们在细节上各有侧重,设计理念也存在差异。
GPT-5.5 发布后,Codex 的迭代明显提速,桌面端功能持续增强,computer use、内置浏览器、桌面宠物、image2 图片生成等能力相继上线,产品体验大幅提升。反观 Anthropic 这边,限速、封号、额度紧张等问题确实让不少用户的体验有所下降。正是这样的反差,使越来越多用户开始将重心转移至 Codex。
如果你已经是 Claude Code 或 Cowork 的用户,读完本教程,你会对 AI 代理工具生态形成更全面的认知,也能明确 Codex 是否值得你同步使用。
假如你是第一次接触这类工具,那再好不过——我们将从零开始,为你理清 Codex 的一切。
对早已将 AI 工具纳入日常工作流的人来说,产品更新速度、可用额度、桌面端体验,已不再仅仅是“加分项”,而是直接决定用户留存的 核心变量。
第一步:Codex 桌面应用安装
Codex 拥有四种产品形态,各有适用场景;
| 场景 | 推荐入口 |
|---|---|
| 长期主力使用,管理多个项目 | 桌面版 App |
| 边写代码边用 AI,不想切换窗口 | IDE 插件 |
| 偏好命令行,在服务器上工作 | CLI |
| 临时体验,或审查 PR | 网页版 |
对于大部分用户,优先推荐直接使用桌面版 App。
相比 Anthropic 的 Cowork,Codex 桌面版提供免费额度,入门门槛更低,无论是首次尝试还是从其他工具迁 移,都更加流畅。
另外三种入口各有典型场景:CLI 需要一定的命令行基础,更适合习惯终端操作的开发者;网页版无需安装,适合临时救急或审查 PR;IDE 插件适合边编码边调用 AI,不想切换窗口;SDK 则为有二次开发需求者准备。
如果你是初次接触 Codex,从桌面版开始最合适。
安装方式
Windows /macOS 均可在官网下载并安装:https://chatgpt.com/zh-Hans-CN/codex/
Windows 用户也可以直接通过微软商店安装,若因系统问题缺少内置商店,可按照以下步骤操作
第一步:获取安装包访问 store.rg-adguard.net,将微软商店 Codex 页面的链接 https://apps.microsoft.com/detail/9plm9xgg6vks 粘贴进去搜索,下载 OpenAI.Codex_26.506.2212.0_x64.msix(417MB)。
第二步:绕过浏览器拦截当浏览器提示「无法安全下载」时,选择「保留」强制下载。
第三步:安装主程序以管理员身份打开 PowerShell,运行:
Add-AppxPackage -Path "下载的.msix的文件位置"
第四步:安装 Visual C++ 运行库(待完成)
$out = "$env:TEMP\vc_redist.x64.exe"
Invoke-WebRequest -Uri "https://aka.ms/vs/17/release/vc_redist.x64.exe" -OutFile $out -UseBasicParsing
Start-Process -FilePath $out -ArgumentList '/install','/quiet','/norestart' -Wait
第五步:重启电脑,打开 Codex

安装完毕后登录,选择“使用 ChatGPT 继续”,浏览器授权后即可完成登录。
⚠️Codex 近期加强了风控策略。
由于免费额度开放后,出现了大量批量注册和刷号行为,如今部分免费账号会触发手机号验证,即使正常用户也可能遇到,并非账号本身有问题。
通常,新注册的免费账号、频繁更换网络环境、异常 IP 等情况更容易触发验证;Plus / Pro 用户相对稳定。
一旦出现验证提示,国内用户可能会遇到验证码无法接收、验证失败等问题。建议提前开启 Google Authenticator 等二次验证方式,能在一定程度上降低后续触发概率。
另外,更换设备时,Codex 的本地登录状态通常保存在:C:\Users\用户名.codex\ 迁移该目录后,部分情况下可以避免重新登录。具体效果可能因版本和环境有所差异。
第二步:模型选择与思考深度

Codex 的模型额度包含在 ChatGPT 账号的套餐之中。若使用 OpenAI API Key 登录 Codex,会按 token 用量计费,但部分云端功能(如云线程)无法使用。总体而言,账号套餐更划算。无论是付费还是免费账号,额度都会每周刷新。

启动 Codex 时,你将面临两个关键选择:采用哪个模型,以及将思考深度调整到哪一档。理清这两点,能帮助你在速度、质量和用量消耗之间找到最佳平衡。
GPT-5.5是当前的主力模型,可覆盖绝大多数场景——重构、调试、编写测试等。官方数据显示,GPT-5.5 完成相同 Codex 任务所消耗的 token 数明显少于上一代,实际使用下来比 Opus 还节省额度。
GPT-5.4:由于 GPT-5.5 在 Codex 中仅提供 400K 上下文,当需要总结分析大型项目文件时,GPT-5.4 的 1M 上下文才够用。
GPT-5.4-mini 推荐在追求更低成本和更短延迟时使用。适合高频、简单的任务,例如批量生成测试、快速语法检查,用量消耗很小。
GPT-5.3-Codex 专为软件工程优化,上下文窗口 400K,在纯编程基准上平均得分 63.1,略高于 GPT-5.5 的 58.6,但在通用代理任务上已被 5.5 超越。其价格更低,适合预算有限的重度编程场景。
智能等级(思考深度)
选定模型后,还可进一步调节推理深度,它直接影响响应速度和用量消耗。支持的档位包括 低、中、高和超高,档位越低速度越快、越节省,档位越高思考越深入但速度放缓。
低(low):最快速,消耗最少。适合生成样板代码、简单 CRUD、快速语法修复等无需深度推理的场景。
中(medium):GPT-5.5 的默认档位,是质量、可靠性与性能的最佳平衡点,也是大多数任务的推荐起点。
高(high):适用于深度架构分析、中等复杂度的重构任务。high 档足以解决多数问题,很少需要升到 xhigh。
超高(xhigh):激活最深的推理链,用于大型重构、安全漏洞审计、框架迁移等要求高深度推理的任务;速度最慢,但质量最高。不宜用在样板代码生成或速度优先的场景。建议仅在极少数真正复杂、模糊的问题上启用,high 档通常已足够。
日常开发以 GPT-5.5 medium 起步,遇到复杂问题升到 high;若预算有限可更换为 GPT-5.3-Codex;简单重复任务使用 GPT-5.4-mini;只有遭遇真正棘手的架构问题或安全审计,才值得开启 xhigh 耐心等待。
第三步:核心功能详解
1. 插件和技能
Codex 的能力边界并非固定不变,插件和技能是拓展它的两条路径,分工明确:技能为 Codex 提供针对特定工作的可复用操作手册,而插件则是将技能、应用集成和 MCP 服务器打包在一起的完整工作流单元。
一个插件可包含三类组件:
技能:为特定类型的工作提供可复用的指令。Codex 会在需要时加载它们,确保遵循正确的步骤、使用正确的参考资料或辅助脚本。
应用集成:连接 GitHub、Slack、Google Drive 等外部工具,让 Codex 能够直接读取这些工具中的信息并采取行动,无需你手动复制粘贴内容到对话中。
MCP 服务器:为 Codex 提供访问额外工具和信息的通道,这类工具通常来自本地项目之外的系统。

插件按用途分为四大类:编程类、设计类、生活方式类、生产力类等。在 Codex 左上角点击「插件」,可以浏览推荐插件、已安装的插件、完整的插件库,或者自行创建新的插件。
创建一个新插件通常比创建一个技能需要更多的技术基础。如果只是希望标准化某个工作流,直接编写技能即可;如需打包分发给团队或连接外部服务,才需要制作成插件。
技能是 Codex 的可复用工作流格式**。它将指令、资源和可选脚本打包,让 Codex 能可靠地遵循特定类型工作的操作流程,建立在开放代理技能标准之上,可在 CLI、IDE 插件和桌面 App 三个入口通用。**
二者区别在于,用技能设计工作流本身,当你想让其他开发者安装使用时,再将其打包成插件。
① 通过插件界面安装
在 Codex 左上角点击「插件」→「技能/Skills」→「管理/创建」,即可浏览并安装现成技能,也可在此处创建新技能。适合不习惯命令行操作的用户。
② 对话中直接调用
在任意线程内输入 /skill 技能名 即可手动触发某个技能,无需等待 Codex 自动判断匹配。
③ 复制到项目目录或全局目录
技能放置路径:~/.agents/skills/(全局),或项目内 .codex/skills/(仅对当前项目生效)。
Codex 的技能目录结构与 Claude Code 的 SKILL.md 格式几乎一致,可直接复用,迁移成本极低。

2. 自动化
Codex 提供两种自动化类型
线程自动化(Thread Automation):绑定至当前线程,如同心跳一般按时唤醒同一个对话。适合需要保留上下文的持续性任务——例如跟进一次部署进度,或持续监控某个项目的 PR 状态。支持分钟级间隔(高频跟进)以及每日/每周的定时检查。
独立/项目自动化(Standalone/Project Automation):每次以全新任务启动,不依附于任何对话线程。适合从零开始的周期性任务。

每个自动化由三部分组成:一段提示词**(用自然语言描述要重复执行的任务)、可选的技能(使用 技能名 语法调用)、以及一个调度计划(每小时、每天、每周或自定义频率)**
在 Codex 桌面 App 的「Automations」标签下创建,选定项目、编写提示词、设置频率即可。也可以直接在普通对话线程中用自然语言告诉 Codex:「帮我创建一个自动化,每周五检查这个项目的 CI 状态」,Codex 会帮你起草提示词、选择合适的类型,并在需要时进行更新。
自动化适用场景
OpenAI 内部常用自动化处理的日常维护任务包括:每日 Issue 分类、CI 失败汇总、发布说明生成、Bug 自动检测等。以下是一些典型的提示词写法:
每周一早上,回到这个对话,根据我当前的笔记和优先级帮我规划本周工作。 每周五,回顾我本周的工作,生成一份简短总结:完成了什么、还有什么待处理、下周需要关注什么。 每天检查这个仓库是否有新的 CI 失败,有的话分析原因并提交修复。
技能定义方法,自动化定义计划。若一个工作流仍需大量人工干预,先将其转化为技能;待其变得可预测后,再添加自动化调度,效果将成倍放大。
- Computer use
Computer Use 让 Codex 能够在 macOS 上查看并操控图形界面,适用于命令行工具或结构化集成无能为力的场景:检查桌面应用、使用浏览器、更改应用设置、处理没有插件可用的数据源,或复现仅出现在图形界面下的 Bug。
该功能在 GPT-5.4 / GPT-5.5(尤其是 xHigh 档)下表现最佳,结合了更强的代理能力。
当前限制:仅支持 macOS,Windows 用户目前无法使用此功能
在 Codex 设置中打开「Computer Use」,点击「Install」安装 Computer Use 插件。macOS 弹出权限请求时,授予以下两项权限:
屏幕录制(Screen Recording)——让 Codex 能够看到目标应用;
辅助功能(Accessibility)——使 Codex 能点击、输入和导航。

如果 Codex 无法查看或控制某个应用,请前往「系统设置 → 隐私与安全性」检查这两项权限是否已为 Codex 启用。
- 应用设置
Codex 的设置页面非常全面,几乎将整个 Agent 工作流开放给用户进行配置。用久了你会发现,OpenAI 在桌面版中打造的其实是一整套长期工作环境。

(1)常规设置:掌控 Agent 运行方式
在 General 中,你可以设定:
- 文件的默认打开方式
- 线程内显示多少命令输出
- 多行 Prompt 是否必须 Cmd+Enter 才发送
- Agent 运行时是否阻止电脑休眠
这些乍看只是小功能,实则严重影响真实工作体验,尤其是长任务场景。Codex 已预设用户可能会跑数小时的任务,因此连系统休眠都纳入了考虑。
(2)通知管理:
通知系统是一个极易被忽略,却能带来巨大体验差距的功能。
你可以设置何时弹出通知、任务完成是否提醒、是否主动请求系统通知权限;这意味着你完全可以放心地将任务交给 Codex,然后切换到浏览器、剪视频或去开会,等它完成后再回来接管。这标志着 AI 正迈入真正的“异步协作”状态。
(3)桌面宠物

你可以在设置中开启桌面宠物,让一个悬浮的小角色陪着 Agent 一起工作。它会根据 Codex 的当前状态变化:正在运行、等待输入、需要 Review、已完成任务,甚至还会显示当前线程的进度提示。
你还可以自己生成宠物。官方提供了 hatch-pet skill,允许 Codex 根据你的项目风格生成全新的 Pet。
(4)Git 集成
Codex 深度整合了 Git,从分支隔离、Diff 审查到 Push 和 PR,整个流程都无需离开 App。
Worktree:并行工作的基石
Codex 解决多代理同时工作的方式是:每个线程自动获得一个独立的 Git Worktree。每个代理在自己的目录下工作,共享同一个 .git 存储,但互不干扰。
Codex 默认使用 detached HEAD,这意味着它可以创建数十个 Worktree 而不会污染你的分支命名空间。只有当你对结果满意,点击「Create branch here」时,才会真正创建一个具名分支。
(5)MCP 连接
MCP 是连接 Codex 与外部工具和系统的开放标准,让 Codex 能直接读取和操作你常用工具中的数据,省去手动复制粘贴的麻烦。
设置 → MCP,启用推荐服务器或添加自定义服务器,需要 OAuth 的会自动触发认证流程。你也可以直接问 Codex:「帮我添加 GitHub MCP」,它会引导你完成安装。
第四步:Codex 与 Claude Code 全面对比

代码风格
Claude Code 能在短时间内推进大量工作,但在长任务中偶尔会出现代码堆砌、忽视项目规范的问题。
Codex 倾向于先理解再动手。它会主动在中途停下来思考,对指令边界和已有架构的遵守更为严格。
前端 / UI 开发
这是两者差距最明显的维度之一。Claude Code 在前端生成能力和审美方面普遍评价更高,UI 完成度强,制作落地页、交互组件更为顺手。Codex 目前的前端输出被社区频繁吐槽「工程感太重」,生成的界面更像能运行的框架,而非具备设计感的成品。
如果你的工作以前端为主,Claude Code 当前是更合适的选择。
后端 / 老项目维护
后端和复杂历史项目是 Codex 的主场。Claude Code 能力同样很强,但在复杂历史项目中,偶尔会出现改动过大、误改上下文的情况。Codex 对复杂逻辑、老代码库、长链路依赖更显谨慎,稳定性和可控性更高。
MCP / 工具调用
Claude Code 更积极地主动调用 MCP 和外部工具,Agent 感更强,给出一个任务它会主动想到该调用哪些工具来辅助。Codex 则倾向于先用基础命令完成任务,MCP 使用相对保守,需要更明确的指引才会调用。
稳定性(国内用户视角)
这是 Codex 目前在国内口碑逆转的核心因素。Claude Code 的限流、风控、KYC 实名、封号等问题频发,重度用户苦不堪言。Codex 整体相对稳定,免费额度与桌面端体验对个人用户更友好。
上手难度
Claude Code 的 CLI 逻辑清晰,开发者容易快速进入状态。Codex 功能更多、入口更复杂,线程、Worktree、Automations 等概念需要花些时间熟悉,但掌握之后工作流的天花板更高。
总结
Claude Code 仍然是许多开发者心目中的「性能怪兽」,尤其在前端和高速迭代场景优势明显。Codex 则更像一个完整的 AI 工作平台,凭借稳定性、产品完成度与更低的使用门槛,正在吸引越来越多的实际用户。很多重度 AI 开发者最终的选择,其实是双持。