2026年GPT-Codex 90天进化实录:GPT-5.5、内置浏览器与插件生态,编程工具变身全能工作平台
90天,3个新模型,1个全新插件生态,1次桌面端大革命。如果你还在用2月份的Codex,那它已经变得你几乎认不出了。
发生了一场「质变」
2026年2月5日,我曾写过一篇《GPT-5.3-Codex重磅发布:代码能力提升150%》,那时我深信这就是2026年AI编程工具的天花板。
我低估了OpenAI的节奏。
此后的90天里,OpenAI一口气完成了下面这些更新:
| 时间 | 事件 | 重要性 |
|---|---|---|
| 3月5日 | GPT-5.4上线,1M上下文窗口+原生Computer Use | 🔥🔥🔥🔥🔥 |
| 3月17日 | GPT-5.4 mini上线,速度快2倍以上 | 🔥🔥🔥🔥 |
| 3月25日 | 插件系统Plugins发布 | 🔥🔥🔥🔥 |
| 4月7日 | 旧模型大规模下线(gpt-5.1全系列) | 🔥🔥🔥 |
| 4月16日 | Codex App大更新:内置浏览器、Computer Use、Memories | 🔥🔥🔥🔥🔥 |
| 4月23日 | GPT-5.5上线 | 🔥🔥🔥🔥🔥 |
| 4月30日 | Codex CLI 0.128:/goal工作流、插件市场 | 🔥🔥🔥🔥 |
这并不是一个简单的版本迭代。
这是Codex从“编程工具”跃迁为“全能工作平台”的质变。
你是否已经感到「代差」?
如果你是在2月份入坑的Codex用户,此刻很可能还困在这些旧习惯里:
❌ 还在用gpt-5.3-codex作为默认模型
❌ 还不知道Codex已经有了桌面App(可不止是CLI)
❌ 还在使用--full-auto模式(已经废弃)
❌ 没试过让Codex操作浏览器
❌ 没体验过Codex的插件生态
而紧跟更新步伐的开发者已经开始这样工作:
✅ 使用GPT-5.5完成最复杂的架构设计
✅ 让Codex直接操作桌面应用,自动测试交互
✅ 通过/goal管理跨天、跨会话的长期任务
✅ 安装插件扩展Codex的能力边界
✅ 在内置浏览器中实时预览前端效果
这不是一点点的差距,而是整整一个时代的落差。
3分钟速览:如今的Codex到底是什么?
它究竟是什么?
2026年2月的Codex:一款强大的AI编程终端工具。
2026年5月的Codex:一个覆盖编程、测试、设计、文档、项目管理的全能AI工作平台。
四大产品形态
| 形态 | 面向谁 | 核心能力 | 上线时间 |
|---|---|---|---|
| Codex CLI | 终端开发者 | 命令行AI编程 | 2025年4月 |
| Codex IDE扩展 | IDE用户 | VS Code / Cursor集成 | 2025年8月 |
| Codex Cloud | 团队协作 | 云端任务、Code Review | 2025年5月 |
| Codex App | 所有人 | 桌面应用,全能工作平台 | 2026年2月 |
重点:这四个产品形态共享同一套账号体系,任务可以在不同终端间无缝切换。
第一大更新:模型三级跃迁
GPT-5.4(3月5日)— 通用之王
GPT-5.4是Codex发展中的一个里程碑:
第一款将推理、编程与Agent能力统一融合的通用模型。
之前的GPT-5.3-Codex专精于编程,而GPT-5.4则将编程、推理和知识工作高度统一。
| 能力 | GPT-5.3-Codex | GPT-5.4 |
|---|---|---|
| 编程 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| 推理 | ⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
| Computer Use | ❌ | ✅ 原生支持 |
| 上下文窗口 | 128K | 1M(实验性) |
| 工具调用 | ⭐⭐⭐⭐ | ⭐⭐⭐⭐⭐ |
关键数据:
- OSWorld测试得分75%,超越人类基线
- 比GPT-5.2的事实错误减少33%
GPT-5.4 mini(3月17日)— 性价比之王
# 使用GPT-5.4 mini
codex --model gpt-5.4-mini
| 对比项 | GPT-5.4 | GPT-5.4 mini |
|---|---|---|
| 编码能力 | ⭐⭐⭐⭐⭐ | ⭐⭐⭐⭐ |
| 推理深度 | 深度 | 适中 |
| 速度 | 快 | 快2倍以上 |
| 用量消耗 | 100% | 仅30% |
| 最佳场景 | 复杂架构、最终决策 | 代码探索、大文件审查、子Agent |
一句话总结:GPT-5.4负责思考,GPT-5.4 mini负责执行。两者配合,用量可以撑到3.3倍。
GPT-5.5(4月23日)— 最新前沿
GPT-5.5是OpenAI当前最强的旗舰模型,于4月23日上线:
# 使用GPT-5.5
codex --model gpt-5.5
# 或在会话中切换
/model gpt-5.5
| 对比 | GPT-5.4 | GPT-5.5 |
|---|---|---|
| 定位 | 通用最强 | 前沿旗舰 |
| 推理 | 强 | 更强 |
| 代码实现 | 强 | 更精准 |
| 知识工作 | 支持 | 深度优化 |
| 推荐场景 | 日常编程 | 复杂架构+研究+深度分析 |
注意:GPT-5.5正在逐步灰度推送。如果你还没有看到它,请更新到最新版CLI/App,暂时可以继续使用GPT-5.4。
旧模型下线(4月7日)
以下模型已从选择器中移除:
| 已下架模型 | 状态 |
|---|---|
| gpt-5.2-codex | ❌ 已移除 |
| gpt-5.1-codex | ❌ 已移除 |
| gpt-5.1-codex-mini | ❌ 已移除 |
| gpt-5.1-codex-max | ❌ 已移除 |
| gpt-5.1 | ❌ 已移除 |
| gpt-5 | ❌ 已移除 |
当前可直接使用的模型清单:
| 模型 | 用途 | 消耗比 |
|---|---|---|
| gpt-5.5 | 前沿旗舰(灰度中) | — |
| gpt-5.4 | 日常主力 | 1x |
| gpt-5.4-mini | 轻量任务/子Agent | 0.3x |
| gpt-5.3-codex | 编程专精 | 1x |
| gpt-5.3-codex-spark | 实时编程(Pro) | 单独限额 |
| gpt-5.2 | 兼容 | 1x |
第二大更新:Codex App的大变身
内置浏览器
Codex App如今拥有了内置浏览器,你可以这样与它协作:
你:帮我把首页的按钮样式调成圆角蓝色
Codex:
✅ 打开本地开发服务器(localhost:3000)
✅ 看到当前页面
✅ 修改按钮样式
✅ 刷新页面并截图给你看
✅ 还需要继续调整吗?
现在你可以:
- 在渲染的页面上直接标注反馈
- 让Codex点击UI元素进行操控
- 复现视觉Bug:截图后Codex自动定位问题
- 完全不必跳出Codex去浏览器查看效果
Computer Use(桌面自动化)
这是4月更新中最具未来感的能力:
Codex现在可以看到你的屏幕,移动鼠标,输入文字,点击按钮。
你:帮我测试一下这个原生App的登录流程
Codex:
✅ 打开App(观察屏幕)
✅ 点击用户名输入框(移动鼠标)
✅ 输入测试账号(键盘输入)
✅ 点击登录按钮
✅ 检查是否跳转到主页
✅ 截图记录测试结果
适用场景:
- 🎯 原生App测试(iOS模拟器、Electron)
- 🎯 低风险的GUI操作
- 🎯 只能通过界面触发的交互
- 🎯 自动化回归测试
注意:Computer Use目前暂不支持欧洲经济区、英国和瑞士。
Chats — 不写代码也能用的对话
新概念:Chats是一种无需选择项目文件夹就能发起的对话线程。
你:帮我分析一下这个API的设计是否合理
(附上API文档链接)
Codex Chat:
✅ 阅读文档
✅ 分析RESTful规范合规性
✅ 指出3个改进建议
✅ 给出修改后的API设计方案
典型场景:
- 📝 技术调研和分析
- 📝 方案设计讨论
- 📝 文档撰写
- 📝 代码审查(无需克隆项目)
Thread Automations — 定时自动化任务
让Codex定时醒来替你检查工作。
场景:你启动了一个长时间运行的部署流程
设置Automation:
- 每30分钟检查部署状态
- 如果失败,即时通知你
- 如果成功,自动运行冒烟测试
Artifact Viewer — 文件预览器
Codex现在可以直接在侧边栏预览生成的文件:
| 文件类型 | 支持预览 |
|---|---|
| ✅ | |
| Excel / CSV | ✅ |
| Word文档 | ✅ |
| PPT | ✅ |
| 图片 | ✅ |
Memories — 记忆系统
Codex现在拥有了持久化记忆:
Codex记住了:
- 你偏好使用TypeScript而不是JavaScript
- 项目使用pnpm而不是npm
- 你喜欢函数式风格
- 测试框架使用Vitest
下次对话时,这些偏好会自动生效。
第三大更新:插件系统(Plugins)
什么是Plugins?
Plugins是Codex在3月25日推出的全新扩展机制,可以将Skills、MCP配置、App集成打包成一个可安装的插件。
my-plugin/
.codex-plugin/
plugin.json # 必须:插件清单
skills/ # 可选:打包的技能
.app.json # 可选:应用/连接器映射
.mcp.json # 可选:MCP服务器配置
assets/ # 可选:图标、截图等
安装插件
# 从插件目录安装
# 在Codex中使用/plugins命令浏览和安装
# 或者用@plugin-creator来创建自己的插件
插件可以安装到两个位置:
- 个人级别:
~/.agents/plugins/marketplace.json - 项目级别:
.agents/plugins/marketplace.json(团队共享)
插件vs Skills 对比
| 维度 | Skills | Plugins |
|---|---|---|
| 内容 | 单个指令文件 | 打包的技能包 |
| 包含内容 | SKILL.md | Skills + MCP + App配置 |
| 安装方式 | 手动/安装器 | 市场一键安装 |
| 分享方式 | 复制文件 | 发布到市场 |
| 适用场景 | 个人/单任务 | 团队/复杂工作流 |
简单理解:Skills是一道菜的做法,Plugins是一整个厨房。
第四大更新:Codex CLI最新功能
/goal工作流(CLI 0.128)
这是CLI在4月30日更新中最重磅的功能:
/goal让你能够管理跨天的长期任务,支持暂停与恢复。
第1天:
你:/goal 完成v2.0的迁移
Codex:已创建目标「完成v2.0的迁移」
✅ 分析了现有架构
✅ 创建了迁移计划
⏸️ 进度30%,还有3个模块待迁移
你:今天先到这里,明天继续
Codex:目标已暂停,明天可以用/goal resume继续
第2天:
你:/goal resume
Codex:继续「完成v2.0的迁移」
✅ 完成了用户模块迁移
✅ 完成了订单模块迁移
✅ 运行测试通过
🎉 目标完成!
支持的操作:
/goal创建新目标/goal resume恢复暂停的目标/goal pause暂停当前目标/goal clear清除目标
权限系统重构
旧版的三种权限模式(suggest / auto-edit / full-auto)已被重构为权限配置文件(Permission Profiles):
| 旧模式 | 新方式 | 说明 |
|---|---|---|
--suggest |
内置profile: read-only |
只读,所有操作需确认 |
--auto-edit |
内置profile: auto |
可编辑工作区,外部操作需确认 |
--full-auto |
⚠️ 已废弃 | 改用显式profile配置 |
# 旧方式(已废弃)
codex --full-auto
# 新方式
codex --profile full-access
# 或在config.toml中配置
为什么废弃–full-auto? OpenAI认为全权限模式风险过高,新方案要求你显式声明信任的权限范围,而不是一键全开。
插件市场
CLI现在同样支持插件市场:
# 浏览可用插件
/plugins
# 从GitHub安装
codex marketplace add github.com/user/plugin
# 从本地目录安装
codex marketplace add /path/to/plugin
MCP增强
# 查看完整MCP诊断信息(服务器状态、资源、工具列表)
/mcp verbose
# 快速查看MCP状态(不触发完整扫描)
/mcp
真实场景:今天的Codex能做什么?
场景1:前端开发全流程
你:帮我做一个电商首页,参考这张截图
(拖入设计稿图片)
Codex App:
✅ 分析设计稿
✅ 生成HTML + Tailwind CSS
✅ 启动本地开发服务器
✅ 内置浏览器打开页面
✅ 对比设计稿,自动调整样式
✅ 截图给你确认
✅ 生成响应式版本
亮点:全程无需离开Codex App,不必手动打开浏览器。
场景2:跨天的迁移任务
你:/goal 把这个项目从JavaScript迁移到TypeScript
Codex(第1天):
✅ 分析项目结构(56个文件)
✅ 创建迁移计划
✅ 完成核心模块(12/56)
⏸️ 进度21%
你:/goal pause(下班了)
Codex(第2天):
你:/goal resume
✅ 继续迁移(28/56)
⏸️ 进度50%
Codex(第3天):
你:/goal resume
✅ 完成全部迁移
✅ 修复类型错误
✅ 运行测试套件全部通过
🎉 目标完成!
场景3:让插件扩展能力
你:/plugins
安装了「数据库专家」插件
你:帮我优化这条SQL查询
(贴上慢查询)
Codex + 数据库插件:
✅ 分析查询计划
✅ 发现缺少索引
✅ 建议CREATE INDEX语句
✅ 预估性能提升10倍
场景4:模型组合策略
你:帮我重构这个大型项目
Codex(自动策略):
🧠 GPT-5.5:分析架构,制定重构计划
↓
🧠 GPT-5.4:执行核心模块重构
↓
⚡ GPT-5.4-mini:扫描所有文件、更新import路径
↓
🧠 GPT-5.4:运行测试,验证重构结果
如何更新到最新版?
Codex CLI
# 方法1:npm全局更新
npm install -g @openai/codex@latest
# 方法2:使用新增的更新命令(0.128+)
codex update
# 验证版本
codex --version
# 应该显示0.128.0或更高
Codex IDE扩展
- 打开VS Code / Cursor
- 进入扩展面板
- 搜索”OpenAI Codex”
- 点击更新
Codex App
- macOS:App会自动更新,或在菜单栏选择“Check for Updates”
- Windows:通过Microsoft Store获取最新版
首次使用GPT-5.5
# CLI
codex --model gpt-5.5
# 或在会话中切换
/model gpt-5.5
# 查看所有可用模型
codex debug models
更新前后对比速查
| 维度 | 2月份的Codex | 5月份的Codex |
|---|---|---|
| 最强模型 | GPT-5.3-Codex | GPT-5.5 |
| 上下文窗口 | 128K | 1M(GPT-5.4) |
| Computer Use | ❌ | ✅ 操作桌面App |
| 内置浏览器 | ❌ | ✅ 预览+标注 |
| 插件系统 | ❌ | ✅ 市场安装 |
| 长期任务 | 单次会话 | /goal持久化 |
| 记忆 | 会话内 | 跨会话Memories |
| 权限管理 | –full-auto | Permission Profiles |
| 文档预览 | 仅代码 | PDF/Excel/Word/PPT |
| 定时任务 | ❌ | ✅ Automations |
常见问题FAQ
Q1:我的GPT-5.3-Codex还能继续用吗?
A:当然可以。GPT-5.3-Codex仍在模型列表里。但gpt-5.1系列(包括codex/mini/max)已经在4月7日全部下架。
Q2:GPT-5.5和GPT-5.4该怎么选?
A:
- GPT-5.5:最新旗舰,推理和知识工作更强,适合复杂任务
- GPT-5.4:稳定主力,编程能力同样顶级,支持1M上下文
- GPT-5.4 mini:日常轻度任务,速度快、用量省
Q3:Computer Use安全吗?
A:Codex运行在沙盒环境中,Computer Use需要你主动授权。建议只在低风险场景(如测试、开发)使用,避免涉及敏感信息的操作。
Q4:–full-auto不能用了怎么办?
A:请使用新的Permission Profiles替代:
# 在config.toml中配置
[permissions]
profile = "full-access"
# 或命令行指定
codex --profile full-access
Q5:插件和Skills到底有什么区别?
A:Skills是单个指令文件(SKILL.md),Plugins是打包好的技能集(Skills + MCP + App配置)。可以把Plugins理解为Skills的“升级版”。
Q6:国内开发者怎么用Codex App?
A:
- 下载Codex App(macOS/Windows)
- 使用ChatGPT账号登录(需科学上网)
- 或配置API Key使用国内中转服务
- Computer Use功能暂不支持欧洲经济区,但国内可用
90天的启示
回顾这90天的更新,几个趋势已经非常明显:
趋势1:模型迭代加速
GPT-5.3-Codex(2月)→ GPT-5.4(3月)→ GPT-5.5(4月)
3个月3个新模型。这远非终点,GPT-5.6或许已经在路上了。
趋势2:从CLI到全能平台
Codex不再只是一个终端工具。CLI、IDE、Cloud、App四条产品线齐头并进,共享同一个Agent内核。
趋势3:生态开放
Plugins插件系统标志着Codex从“封闭产品”走向“开放生态”。任何人都可以创建并分享插件。
趋势4:安全性收敛
--full-auto被废弃、Permission Profiles引入、沙盒持续加固。更强的能力正在匹配更严格的约束。
行动建议
如果你还没更新Codex:
1. 📦 立即将CLI更新到0.128+
2. 🧠 尝试将GPT-5.4作为日常主力模型
3. 🧪 体验Computer Use(找一个测试项目来试)
4. 📦 浏览插件目录,安装一两个感兴趣的
5. 🎯 用/goal管理你的下一个大任务
延伸阅读
- Codex官方更新日志
- GPT-5.4发布公告
- Codex插件文档
- Codex CLI GitHub