2025年Codex完全上手指南：桌面应用、模型选择、技巧及与Claude Code对比

May 11, 2026

文章大纲：

第一部分安装Codex桌面应用

第二部分模型选择与思考深度配置

第三部分核心功能详解

第四部分 Codex与Claude Code全方位对比

若你曾用过 Claude Code，那么上手 Codex 将水到渠成。

过去一年，Anthropic 陆续推出了多款令人瞩目的 AI 工具。Claude Code 直接将 Agent 能力带入命令行，能够阅读项目、修改文件、执行指令，构建出真正融入开发流程的智能工作流。随后推出的 Cowork，更将相同的代理逻辑拓展至桌面端，面向更广泛的知识工作者——用户无需描述每一步操作，只需提出目标，AI 便会自动扫描文件、提取信息、整理内容，并将结果回传等候确认。

那么，作为 Anthropic 的竞争对手，OpenAI 拿出的对应产品是什么？答案正是 Codex。

Codex 是 OpenAI 的新一代 AI 编程代理，覆盖桌面应用、Web 端、命令行工具、IDE 插件及 SDK 等多个入口，几乎贯通了从灵感到落地的完整链条。你可以在桌面端直接启动任务，在终端内深度编排，在 IDE 里边编码边调试，也可以将其接入个人的自动化流程中，让它持续处理长任务、并行任务和审查任务。

如果你熟悉 Anthropic 的产品矩阵，可以按以下关系理解两家的对应布局：

Anthropic	OpenAI
Claude Code（命令行，面向开发者）	Codex CLI
Cowork（桌面，面向知识工作者）	Codex 桌面版 APP
Claude.ai 网页版	chatgpt 网页版
Claude IDE 插件	Codex IDE 插件

当然，二者并非简单的镜像复制，它们在细节上各有侧重，设计理念也存在差异。

GPT-5.5 发布后，Codex 的迭代明显提速，桌面端功能持续增强，computer use、内置浏览器、桌面宠物、image2 图片生成等能力相继上线，产品体验大幅提升。反观 Anthropic 这边，限速、封号、额度紧张等问题确实让不少用户的体验有所下降。正是这样的反差，使越来越多用户开始将重心转移至 Codex。

如果你已经是 Claude Code 或 Cowork 的用户，读完本教程，你会对 AI 代理工具生态形成更全面的认知，也能明确 Codex 是否值得你同步使用。

假如你是第一次接触这类工具，那再好不过——我们将从零开始，为你理清 Codex 的一切。

对早已将 AI 工具纳入日常工作流的人来说，产品更新速度、可用额度、桌面端体验，已不再仅仅是“加分项”，而是直接决定用户留存的核心变量。

第一步：Codex 桌面应用安装

Codex 拥有四种产品形态，各有适用场景；

场景	推荐入口
长期主力使用，管理多个项目	桌面版 App
边写代码边用 AI，不想切换窗口	IDE 插件
偏好命令行，在服务器上工作	CLI
临时体验，或审查 PR	网页版

对于大部分用户，优先推荐直接使用桌面版 App。

相比 Anthropic 的 Cowork，Codex 桌面版提供免费额度，入门门槛更低，无论是首次尝试还是从其他工具迁移，都更加流畅。

另外三种入口各有典型场景：CLI 需要一定的命令行基础，更适合习惯终端操作的开发者；网页版无需安装，适合临时救急或审查 PR；IDE 插件适合边编码边调用 AI，不想切换窗口；SDK 则为有二次开发需求者准备。

如果你是初次接触 Codex，从桌面版开始最合适。

安装方式

Windows /macOS 均可在官网下载并安装：https://chatgpt.com/zh-Hans-CN/codex/

Windows 用户也可以直接通过微软商店安装，若因系统问题缺少内置商店，可按照以下步骤操作

第一步：获取安装包访问 store.rg-adguard.net，将微软商店 Codex 页面的链接 https://apps.microsoft.com/detail/9plm9xgg6vks 粘贴进去搜索，下载 OpenAI.Codex_26.506.2212.0_x64.msix（417MB）。

第二步：绕过浏览器拦截当浏览器提示「无法安全下载」时，选择「保留」强制下载。

第三步：安装主程序以管理员身份打开 PowerShell，运行：

Add-AppxPackage -Path "下载的.msix的文件位置"

第四步：安装 Visual C++ 运行库（待完成）

$out = "$env:TEMP\vc_redist.x64.exe"
Invoke-WebRequest -Uri "https://aka.ms/vs/17/release/vc_redist.x64.exe" -OutFile $out -UseBasicParsing
Start-Process -FilePath $out -ArgumentList '/install','/quiet','/norestart' -Wait

第五步：重启电脑，打开 Codex

安装完毕后登录，选择“使用 ChatGPT 继续”，浏览器授权后即可完成登录。

⚠️Codex 近期加强了风控策略。
由于免费额度开放后，出现了大量批量注册和刷号行为，如今部分免费账号会触发手机号验证，即使正常用户也可能遇到，并非账号本身有问题。
通常，新注册的免费账号、频繁更换网络环境、异常 IP 等情况更容易触发验证；Plus / Pro 用户相对稳定。
一旦出现验证提示，国内用户可能会遇到验证码无法接收、验证失败等问题。建议提前开启 Google Authenticator 等二次验证方式，能在一定程度上降低后续触发概率。
另外，更换设备时，Codex 的本地登录状态通常保存在：C:\Users\用户名.codex\ 迁移该目录后，部分情况下可以避免重新登录。具体效果可能因版本和环境有所差异。

第二步：模型选择与思考深度

Codex 的模型额度包含在 ChatGPT 账号的套餐之中。若使用 OpenAI API Key 登录 Codex，会按 token 用量计费，但部分云端功能（如云线程）无法使用。总体而言，账号套餐更划算。无论是付费还是免费账号，额度都会每周刷新。

启动 Codex 时，你将面临两个关键选择：采用哪个模型，以及将思考深度调整到哪一档。理清这两点，能帮助你在速度、质量和用量消耗之间找到最佳平衡。

GPT-5.5是当前的主力模型，可覆盖绝大多数场景——重构、调试、编写测试等。官方数据显示，GPT-5.5 完成相同 Codex 任务所消耗的 token 数明显少于上一代，实际使用下来比 Opus 还节省额度。

GPT-5.4：由于 GPT-5.5 在 Codex 中仅提供 400K 上下文，当需要总结分析大型项目文件时，GPT-5.4 的 1M 上下文才够用。

GPT-5.4-mini 推荐在追求更低成本和更短延迟时使用。适合高频、简单的任务，例如批量生成测试、快速语法检查，用量消耗很小。

GPT-5.3-Codex 专为软件工程优化，上下文窗口 400K，在纯编程基准上平均得分 63.1，略高于 GPT-5.5 的 58.6，但在通用代理任务上已被 5.5 超越。其价格更低，适合预算有限的重度编程场景。

智能等级（思考深度）

选定模型后，还可进一步调节推理深度，它直接影响响应速度和用量消耗。支持的档位包括低、中、高和超高，档位越低速度越快、越节省，档位越高思考越深入但速度放缓。

低（low）：最快速，消耗最少。适合生成样板代码、简单 CRUD、快速语法修复等无需深度推理的场景。

中（medium）：GPT-5.5 的默认档位，是质量、可靠性与性能的最佳平衡点，也是大多数任务的推荐起点。

高（high）：适用于深度架构分析、中等复杂度的重构任务。high 档足以解决多数问题，很少需要升到 xhigh。

超高（xhigh）：激活最深的推理链，用于大型重构、安全漏洞审计、框架迁移等要求高深度推理的任务；速度最慢，但质量最高。不宜用在样板代码生成或速度优先的场景。建议仅在极少数真正复杂、模糊的问题上启用，high 档通常已足够。

日常开发以 GPT-5.5 medium 起步，遇到复杂问题升到 high；若预算有限可更换为 GPT-5.3-Codex；简单重复任务使用 GPT-5.4-mini；只有遭遇真正棘手的架构问题或安全审计，才值得开启 xhigh 耐心等待。

第三步：核心功能详解

1. 插件和技能

Codex 的能力边界并非固定不变，插件和技能是拓展它的两条路径，分工明确：技能为 Codex 提供针对特定工作的可复用操作手册，而插件则是将技能、应用集成和 MCP 服务器打包在一起的完整工作流单元。

一个插件可包含三类组件：

技能：为特定类型的工作提供可复用的指令。Codex 会在需要时加载它们，确保遵循正确的步骤、使用正确的参考资料或辅助脚本。

应用集成：连接 GitHub、Slack、Google Drive 等外部工具，让 Codex 能够直接读取这些工具中的信息并采取行动，无需你手动复制粘贴内容到对话中。

MCP 服务器：为 Codex 提供访问额外工具和信息的通道，这类工具通常来自本地项目之外的系统。

插件按用途分为四大类：编程类、设计类、生活方式类、生产力类等。在 Codex 左上角点击「插件」，可以浏览推荐插件、已安装的插件、完整的插件库，或者自行创建新的插件。

创建一个新插件通常比创建一个技能需要更多的技术基础。如果只是希望标准化某个工作流，直接编写技能即可；如需打包分发给团队或连接外部服务，才需要制作成插件。

技能是 Codex 的可复用工作流格式**。它将指令、资源和可选脚本打包，让 Codex 能可靠地遵循特定类型工作的操作流程，建立在开放代理技能标准之上，可在 CLI、IDE 插件和桌面 App 三个入口通用。**

二者区别在于，用技能设计工作流本身，当你想让其他开发者安装使用时，再将其打包成插件。

① 通过插件界面安装

在 Codex 左上角点击「插件」→「技能/Skills」→「管理/创建」，即可浏览并安装现成技能，也可在此处创建新技能。适合不习惯命令行操作的用户。

② 对话中直接调用

在任意线程内输入 /skill 技能名 即可手动触发某个技能，无需等待 Codex 自动判断匹配。

技能放置路径：~/.agents/skills/（全局），或项目内 .codex/skills/（仅对当前项目生效）。

Codex 的技能目录结构与 Claude Code 的 SKILL.md 格式几乎一致，可直接复用，迁移成本极低。

2. 自动化

Codex 提供两种自动化类型

线程自动化（Thread Automation）：绑定至当前线程，如同心跳一般按时唤醒同一个对话。适合需要保留上下文的持续性任务——例如跟进一次部署进度，或持续监控某个项目的 PR 状态。支持分钟级间隔（高频跟进）以及每日/每周的定时检查。

独立/项目自动化（Standalone/Project Automation）：每次以全新任务启动，不依附于任何对话线程。适合从零开始的周期性任务。

每个自动化由三部分组成：一段提示词**（用自然语言描述要重复执行的任务）、可选的技能（使用 技能名 语法调用）、以及一个调度计划（每小时、每天、每周或自定义频率）**

在 Codex 桌面 App 的「Automations」标签下创建，选定项目、编写提示词、设置频率即可。也可以直接在普通对话线程中用自然语言告诉 Codex：「帮我创建一个自动化，每周五检查这个项目的 CI 状态」，Codex 会帮你起草提示词、选择合适的类型，并在需要时进行更新。

自动化适用场景

OpenAI 内部常用自动化处理的日常维护任务包括：每日 Issue 分类、CI 失败汇总、发布说明生成、Bug 自动检测等。以下是一些典型的提示词写法：

 每周一早上，回到这个对话，根据我当前的笔记和优先级帮我规划本周工作。 每周五，回顾我本周的工作，生成一份简短总结：完成了什么、还有什么待处理、下周需要关注什么。 每天检查这个仓库是否有新的 CI 失败，有的话分析原因并提交修复。

技能定义方法，自动化定义计划。若一个工作流仍需大量人工干预，先将其转化为技能；待其变得可预测后，再添加自动化调度，效果将成倍放大。

Computer use

Computer Use 让 Codex 能够在 macOS 上查看并操控图形界面，适用于命令行工具或结构化集成无能为力的场景：检查桌面应用、使用浏览器、更改应用设置、处理没有插件可用的数据源，或复现仅出现在图形界面下的 Bug。

该功能在 GPT-5.4 / GPT-5.5（尤其是 xHigh 档）下表现最佳，结合了更强的代理能力。

当前限制：仅支持 macOS，Windows 用户目前无法使用此功能

在 Codex 设置中打开「Computer Use」，点击「Install」安装 Computer Use 插件。macOS 弹出权限请求时，授予以下两项权限：

屏幕录制（Screen Recording）——让 Codex 能够看到目标应用；

辅助功能（Accessibility）——使 Codex 能点击、输入和导航。

如果 Codex 无法查看或控制某个应用，请前往「系统设置 → 隐私与安全性」检查这两项权限是否已为 Codex 启用。

应用设置

Codex 的设置页面非常全面，几乎将整个 Agent 工作流开放给用户进行配置。用久了你会发现，OpenAI 在桌面版中打造的其实是一整套长期工作环境。

（1）常规设置：掌控 Agent 运行方式

在 General 中，你可以设定：

文件的默认打开方式
线程内显示多少命令输出
多行 Prompt 是否必须 Cmd+Enter 才发送
Agent 运行时是否阻止电脑休眠

这些乍看只是小功能，实则严重影响真实工作体验，尤其是长任务场景。Codex 已预设用户可能会跑数小时的任务，因此连系统休眠都纳入了考虑。

（2）通知管理：

通知系统是一个极易被忽略，却能带来巨大体验差距的功能。

你可以设置何时弹出通知、任务完成是否提醒、是否主动请求系统通知权限；这意味着你完全可以放心地将任务交给 Codex，然后切换到浏览器、剪视频或去开会，等它完成后再回来接管。这标志着 AI 正迈入真正的“异步协作”状态。

（3）桌面宠物

你可以在设置中开启桌面宠物，让一个悬浮的小角色陪着 Agent 一起工作。它会根据 Codex 的当前状态变化：正在运行、等待输入、需要 Review、已完成任务，甚至还会显示当前线程的进度提示。

你还可以自己生成宠物。官方提供了 hatch-pet skill，允许 Codex 根据你的项目风格生成全新的 Pet。

（4）Git 集成

Codex 深度整合了 Git，从分支隔离、Diff 审查到 Push 和 PR，整个流程都无需离开 App。

Worktree：并行工作的基石

Codex 解决多代理同时工作的方式是：每个线程自动获得一个独立的 Git Worktree。每个代理在自己的目录下工作，共享同一个 .git 存储，但互不干扰。

Codex 默认使用 detached HEAD，这意味着它可以创建数十个 Worktree 而不会污染你的分支命名空间。只有当你对结果满意，点击「Create branch here」时，才会真正创建一个具名分支。

（5）MCP 连接

MCP 是连接 Codex 与外部工具和系统的开放标准，让 Codex 能直接读取和操作你常用工具中的数据，省去手动复制粘贴的麻烦。

设置 → MCP，启用推荐服务器或添加自定义服务器，需要 OAuth 的会自动触发认证流程。你也可以直接问 Codex：「帮我添加 GitHub MCP」，它会引导你完成安装。

第四步：Codex 与 Claude Code 全面对比

代码风格

Claude Code 能在短时间内推进大量工作，但在长任务中偶尔会出现代码堆砌、忽视项目规范的问题。

Codex 倾向于先理解再动手。它会主动在中途停下来思考，对指令边界和已有架构的遵守更为严格。

前端 / UI 开发

这是两者差距最明显的维度之一。Claude Code 在前端生成能力和审美方面普遍评价更高，UI 完成度强，制作落地页、交互组件更为顺手。Codex 目前的前端输出被社区频繁吐槽「工程感太重」，生成的界面更像能运行的框架，而非具备设计感的成品。

如果你的工作以前端为主，Claude Code 当前是更合适的选择。

后端 / 老项目维护

后端和复杂历史项目是 Codex 的主场。Claude Code 能力同样很强，但在复杂历史项目中，偶尔会出现改动过大、误改上下文的情况。Codex 对复杂逻辑、老代码库、长链路依赖更显谨慎，稳定性和可控性更高。

MCP / 工具调用

Claude Code 更积极地主动调用 MCP 和外部工具，Agent 感更强，给出一个任务它会主动想到该调用哪些工具来辅助。Codex 则倾向于先用基础命令完成任务，MCP 使用相对保守，需要更明确的指引才会调用。

稳定性（国内用户视角）

这是 Codex 目前在国内口碑逆转的核心因素。Claude Code 的限流、风控、KYC 实名、封号等问题频发，重度用户苦不堪言。Codex 整体相对稳定，免费额度与桌面端体验对个人用户更友好。

上手难度

Claude Code 的 CLI 逻辑清晰，开发者容易快速进入状态。Codex 功能更多、入口更复杂，线程、Worktree、Automations 等概念需要花些时间熟悉，但掌握之后工作流的天花板更高。

总结

Claude Code 仍然是许多开发者心目中的「性能怪兽」，尤其在前端和高速迭代场景优势明显。Codex 则更像一个完整的 AI 工作平台，凭借稳定性、产品完成度与更低的使用门槛，正在吸引越来越多的实际用户。很多重度 AI 开发者最终的选择，其实是双持。