2026年GPT-Codex 90天进化实录：GPT-5.5、内置浏览器与插件生态，编程工具变身全能工作平台

May 10, 2026

90天，3个新模型，1个全新插件生态，1次桌面端大革命。如果你还在用2月份的Codex，那它已经变得你几乎认不出了。

发生了一场「质变」

2026年2月5日，我曾写过一篇《GPT-5.3-Codex重磅发布：代码能力提升150%》，那时我深信这就是2026年AI编程工具的天花板。

我低估了OpenAI的节奏。

此后的90天里，OpenAI一口气完成了下面这些更新：

时间	事件	重要性
3月5日	GPT-5.4上线，1M上下文窗口+原生Computer Use	🔥🔥🔥🔥🔥
3月17日	GPT-5.4 mini上线，速度快2倍以上	🔥🔥🔥🔥
3月25日	插件系统Plugins发布	🔥🔥🔥🔥
4月7日	旧模型大规模下线（gpt-5.1全系列）	🔥🔥🔥
4月16日	Codex App大更新：内置浏览器、Computer Use、Memories	🔥🔥🔥🔥🔥
4月23日	GPT-5.5上线	🔥🔥🔥🔥🔥
4月30日	Codex CLI 0.128：/goal工作流、插件市场	🔥🔥🔥🔥

这并不是一个简单的版本迭代。

这是Codex从“编程工具”跃迁为“全能工作平台”的质变。

你是否已经感到「代差」？

如果你是在2月份入坑的Codex用户，此刻很可能还困在这些旧习惯里：

❌ 还在用gpt-5.3-codex作为默认模型  
❌ 还不知道Codex已经有了桌面App（可不止是CLI）  
❌ 还在使用--full-auto模式（已经废弃）  
❌ 没试过让Codex操作浏览器  
❌ 没体验过Codex的插件生态

而紧跟更新步伐的开发者已经开始这样工作：

✅ 使用GPT-5.5完成最复杂的架构设计  
✅ 让Codex直接操作桌面应用，自动测试交互  
✅ 通过/goal管理跨天、跨会话的长期任务  
✅ 安装插件扩展Codex的能力边界  
✅ 在内置浏览器中实时预览前端效果

这不是一点点的差距，而是整整一个时代的落差。

3分钟速览：如今的Codex到底是什么？

它究竟是什么？

2026年2月的Codex：一款强大的AI编程终端工具。

2026年5月的Codex：一个覆盖编程、测试、设计、文档、项目管理的全能AI工作平台。

四大产品形态

形态	面向谁	核心能力	上线时间
Codex CLI	终端开发者	命令行AI编程	2025年4月
Codex IDE扩展	IDE用户	VS Code / Cursor集成	2025年8月
Codex Cloud	团队协作	云端任务、Code Review	2025年5月
Codex App	所有人	桌面应用，全能工作平台	2026年2月

重点：这四个产品形态共享同一套账号体系，任务可以在不同终端间无缝切换。

第一大更新：模型三级跃迁

GPT-5.4（3月5日）— 通用之王

GPT-5.4是Codex发展中的一个里程碑：

第一款将推理、编程与Agent能力统一融合的通用模型。

之前的GPT-5.3-Codex专精于编程，而GPT-5.4则将编程、推理和知识工作高度统一。

能力	GPT-5.3-Codex	GPT-5.4
编程	⭐⭐⭐⭐⭐	⭐⭐⭐⭐⭐
推理	⭐⭐⭐	⭐⭐⭐⭐⭐
Computer Use	❌	✅ 原生支持
上下文窗口	128K	1M（实验性）
工具调用	⭐⭐⭐⭐	⭐⭐⭐⭐⭐

关键数据：

OSWorld测试得分75%，超越人类基线
比GPT-5.2的事实错误减少33%

GPT-5.4 mini（3月17日）— 性价比之王

# 使用GPT-5.4 mini  
codex --model gpt-5.4-mini

对比项	GPT-5.4	GPT-5.4 mini
编码能力	⭐⭐⭐⭐⭐	⭐⭐⭐⭐
推理深度	深度	适中
速度	快	快2倍以上
用量消耗	100%	仅30%
最佳场景	复杂架构、最终决策	代码探索、大文件审查、子Agent

一句话总结：GPT-5.4负责思考，GPT-5.4 mini负责执行。两者配合，用量可以撑到3.3倍。

GPT-5.5（4月23日）— 最新前沿

GPT-5.5是OpenAI当前最强的旗舰模型，于4月23日上线：

# 使用GPT-5.5  
codex --model gpt-5.5  
  
# 或在会话中切换  
/model gpt-5.5

对比	GPT-5.4	GPT-5.5
定位	通用最强	前沿旗舰
推理	强	更强
代码实现	强	更精准
知识工作	支持	深度优化
推荐场景	日常编程	复杂架构+研究+深度分析

注意：GPT-5.5正在逐步灰度推送。如果你还没有看到它，请更新到最新版CLI/App，暂时可以继续使用GPT-5.4。

旧模型下线（4月7日）

以下模型已从选择器中移除：

已下架模型	状态
gpt-5.2-codex	❌ 已移除
gpt-5.1-codex	❌ 已移除
gpt-5.1-codex-mini	❌ 已移除
gpt-5.1-codex-max	❌ 已移除
gpt-5.1	❌ 已移除
gpt-5	❌ 已移除

当前可直接使用的模型清单：

模型	用途	消耗比
gpt-5.5	前沿旗舰（灰度中）	—
gpt-5.4	日常主力	1x
gpt-5.4-mini	轻量任务/子Agent	0.3x
gpt-5.3-codex	编程专精	1x
gpt-5.3-codex-spark	实时编程（Pro）	单独限额
gpt-5.2	兼容	1x

第二大更新：Codex App的大变身

内置浏览器

Codex App如今拥有了内置浏览器，你可以这样与它协作：

你：帮我把首页的按钮样式调成圆角蓝色  
  
Codex：  
✅ 打开本地开发服务器（localhost:3000）  
✅ 看到当前页面  
✅ 修改按钮样式  
✅ 刷新页面并截图给你看  
✅ 还需要继续调整吗？

现在你可以：

在渲染的页面上直接标注反馈
让Codex点击UI元素进行操控
复现视觉Bug：截图后Codex自动定位问题
完全不必跳出Codex去浏览器查看效果

Computer Use（桌面自动化）

这是4月更新中最具未来感的能力：

Codex现在可以看到你的屏幕，移动鼠标，输入文字，点击按钮。

你：帮我测试一下这个原生App的登录流程  
  
Codex：  
✅ 打开App（观察屏幕）  
✅ 点击用户名输入框（移动鼠标）  
✅ 输入测试账号（键盘输入）  
✅ 点击登录按钮  
✅ 检查是否跳转到主页  
✅ 截图记录测试结果

适用场景：

🎯 原生App测试（iOS模拟器、Electron）
🎯 低风险的GUI操作
🎯 只能通过界面触发的交互
🎯 自动化回归测试

注意：Computer Use目前暂不支持欧洲经济区、英国和瑞士。

Chats — 不写代码也能用的对话

新概念：Chats是一种无需选择项目文件夹就能发起的对话线程。

你：帮我分析一下这个API的设计是否合理  
    （附上API文档链接）  
  
Codex Chat：  
✅ 阅读文档  
✅ 分析RESTful规范合规性  
✅ 指出3个改进建议  
✅ 给出修改后的API设计方案

典型场景：

📝 技术调研和分析
📝 方案设计讨论
📝 文档撰写
📝 代码审查（无需克隆项目）

Thread Automations — 定时自动化任务

让Codex定时醒来替你检查工作。

场景：你启动了一个长时间运行的部署流程  
  
设置Automation：  
- 每30分钟检查部署状态  
- 如果失败，即时通知你  
- 如果成功，自动运行冒烟测试

Artifact Viewer — 文件预览器

Codex现在可以直接在侧边栏预览生成的文件：

文件类型	支持预览
PDF	✅
Excel / CSV	✅
Word文档	✅
PPT	✅
图片	✅

Memories — 记忆系统

Codex现在拥有了持久化记忆：

Codex记住了：  
- 你偏好使用TypeScript而不是JavaScript  
- 项目使用pnpm而不是npm  
- 你喜欢函数式风格  
- 测试框架使用Vitest  
  
下次对话时，这些偏好会自动生效。

第三大更新：插件系统（Plugins）

什么是Plugins？

Plugins是Codex在3月25日推出的全新扩展机制，可以将Skills、MCP配置、App集成打包成一个可安装的插件。

my-plugin/  
  .codex-plugin/  
    plugin.json     # 必须：插件清单  
  skills/           # 可选：打包的技能  
  .app.json         # 可选：应用/连接器映射  
  .mcp.json         # 可选：MCP服务器配置  
  assets/           # 可选：图标、截图等

安装插件

# 从插件目录安装  
# 在Codex中使用/plugins命令浏览和安装  
  
# 或者用@plugin-creator来创建自己的插件

插件可以安装到两个位置：

个人级别：~/.agents/plugins/marketplace.json
项目级别：.agents/plugins/marketplace.json（团队共享）

插件vs Skills 对比

维度	Skills	Plugins
内容	单个指令文件	打包的技能包
包含内容	SKILL.md	Skills + MCP + App配置
安装方式	手动/安装器	市场一键安装
分享方式	复制文件	发布到市场
适用场景	个人/单任务	团队/复杂工作流

简单理解：Skills是一道菜的做法，Plugins是一整个厨房。

第四大更新：Codex CLI最新功能

/goal工作流（CLI 0.128）

这是CLI在4月30日更新中最重磅的功能：

/goal让你能够管理跨天的长期任务，支持暂停与恢复。

第1天：  
你：/goal 完成v2.0的迁移  
Codex：已创建目标「完成v2.0的迁移」  
        ✅ 分析了现有架构  
        ✅ 创建了迁移计划  
        ⏸️  进度30%，还有3个模块待迁移  
  
你：今天先到这里，明天继续  
Codex：目标已暂停，明天可以用/goal resume继续  
  
第2天：  
你：/goal resume  
Codex：继续「完成v2.0的迁移」  
        ✅ 完成了用户模块迁移  
        ✅ 完成了订单模块迁移  
        ✅ 运行测试通过  
        🎉 目标完成！

支持的操作：

/goal 创建新目标
/goal resume 恢复暂停的目标
/goal pause 暂停当前目标
/goal clear 清除目标

权限系统重构

旧版的三种权限模式（suggest / auto-edit / full-auto）已被重构为权限配置文件（Permission Profiles）：

旧模式	新方式	说明
`--suggest`	内置profile: `read-only`	只读，所有操作需确认
`--auto-edit`	内置profile: `auto`	可编辑工作区，外部操作需确认
`--full-auto`	⚠️ 已废弃	改用显式profile配置

# 旧方式（已废弃）  
codex --full-auto  
  
# 新方式  
codex --profile full-access  
# 或在config.toml中配置

为什么废弃–full-auto？ OpenAI认为全权限模式风险过高，新方案要求你显式声明信任的权限范围，而不是一键全开。

插件市场

CLI现在同样支持插件市场：

# 浏览可用插件  
/plugins  
  
# 从GitHub安装  
codex marketplace add github.com/user/plugin  
  
# 从本地目录安装  
codex marketplace add /path/to/plugin

MCP增强

# 查看完整MCP诊断信息（服务器状态、资源、工具列表）  
/mcp verbose  
  
# 快速查看MCP状态（不触发完整扫描）  
/mcp

真实场景：今天的Codex能做什么？

场景1：前端开发全流程

你：帮我做一个电商首页，参考这张截图  
    （拖入设计稿图片）  
  
Codex App：  
✅ 分析设计稿  
✅ 生成HTML + Tailwind CSS  
✅ 启动本地开发服务器  
✅ 内置浏览器打开页面  
✅ 对比设计稿，自动调整样式  
✅ 截图给你确认  
✅ 生成响应式版本

亮点：全程无需离开Codex App，不必手动打开浏览器。

场景2：跨天的迁移任务

你：/goal 把这个项目从JavaScript迁移到TypeScript  
  
Codex（第1天）：  
✅ 分析项目结构（56个文件）  
✅ 创建迁移计划  
✅ 完成核心模块（12/56）  
⏸️  进度21%  
  
你：/goal pause（下班了）  
  
Codex（第2天）：  
你：/goal resume  
✅ 继续迁移（28/56）  
⏸️  进度50%  
  
Codex（第3天）：  
你：/goal resume  
✅ 完成全部迁移  
✅ 修复类型错误  
✅ 运行测试套件全部通过  
🎉 目标完成！

场景3：让插件扩展能力

你：/plugins  
    安装了「数据库专家」插件  
  
你：帮我优化这条SQL查询  
    （贴上慢查询）  
  
Codex + 数据库插件：  
✅ 分析查询计划  
✅ 发现缺少索引  
✅ 建议CREATE INDEX语句  
✅ 预估性能提升10倍

场景4：模型组合策略

你：帮我重构这个大型项目  
  
Codex（自动策略）：  
🧠 GPT-5.5：分析架构，制定重构计划  
    ↓  
🧠 GPT-5.4：执行核心模块重构  
    ↓  
⚡ GPT-5.4-mini：扫描所有文件、更新import路径  
    ↓  
🧠 GPT-5.4：运行测试，验证重构结果

如何更新到最新版？

Codex CLI

# 方法1：npm全局更新  
npm install -g @openai/codex@latest  
  
# 方法2：使用新增的更新命令（0.128+）  
codex update  
  
# 验证版本  
codex --version  
# 应该显示0.128.0或更高

Codex IDE扩展

打开VS Code / Cursor
进入扩展面板
搜索”OpenAI Codex”
点击更新

Codex App

macOS：App会自动更新，或在菜单栏选择“Check for Updates”
Windows：通过Microsoft Store获取最新版

首次使用GPT-5.5

# CLI  
codex --model gpt-5.5  
  
# 或在会话中切换  
/model gpt-5.5  
  
# 查看所有可用模型  
codex debug models

更新前后对比速查

维度	2月份的Codex	5月份的Codex
最强模型	GPT-5.3-Codex	GPT-5.5
上下文窗口	128K	1M（GPT-5.4）
Computer Use	❌	✅ 操作桌面App
内置浏览器	❌	✅ 预览+标注
插件系统	❌	✅ 市场安装
长期任务	单次会话	/goal持久化
记忆	会话内	跨会话Memories
权限管理	–full-auto	Permission Profiles
文档预览	仅代码	PDF/Excel/Word/PPT
定时任务	❌	✅ Automations

常见问题FAQ

Q1：我的GPT-5.3-Codex还能继续用吗？

A：当然可以。GPT-5.3-Codex仍在模型列表里。但gpt-5.1系列（包括codex/mini/max）已经在4月7日全部下架。

Q2：GPT-5.5和GPT-5.4该怎么选？

A：

GPT-5.5：最新旗舰，推理和知识工作更强，适合复杂任务
GPT-5.4：稳定主力，编程能力同样顶级，支持1M上下文
GPT-5.4 mini：日常轻度任务，速度快、用量省

Q3：Computer Use安全吗？

A：Codex运行在沙盒环境中，Computer Use需要你主动授权。建议只在低风险场景（如测试、开发）使用，避免涉及敏感信息的操作。

Q4：–full-auto不能用了怎么办？

A：请使用新的Permission Profiles替代：

# 在config.toml中配置  
[permissions]  
profile = "full-access"  
  
# 或命令行指定  
codex --profile full-access

Q5：插件和Skills到底有什么区别？

A：Skills是单个指令文件（SKILL.md），Plugins是打包好的技能集（Skills + MCP + App配置）。可以把Plugins理解为Skills的“升级版”。

Q6：国内开发者怎么用Codex App？

A：

下载Codex App（macOS/Windows）
使用ChatGPT账号登录（需科学上网）
或配置API Key使用国内中转服务
Computer Use功能暂不支持欧洲经济区，但国内可用

90天的启示

回顾这90天的更新，几个趋势已经非常明显：

趋势1：模型迭代加速

GPT-5.3-Codex（2月）→ GPT-5.4（3月）→ GPT-5.5（4月）

3个月3个新模型。这远非终点，GPT-5.6或许已经在路上了。

趋势2：从CLI到全能平台

Codex不再只是一个终端工具。CLI、IDE、Cloud、App四条产品线齐头并进，共享同一个Agent内核。

趋势3：生态开放

Plugins插件系统标志着Codex从“封闭产品”走向“开放生态”。任何人都可以创建并分享插件。

趋势4：安全性收敛

--full-auto被废弃、Permission Profiles引入、沙盒持续加固。更强的能力正在匹配更严格的约束。

行动建议

如果你还没更新Codex：  
1. 📦 立即将CLI更新到0.128+  
2. 🧠 尝试将GPT-5.4作为日常主力模型  
3. 🧪 体验Computer Use（找一个测试项目来试）  
4. 📦 浏览插件目录，安装一两个感兴趣的  
5. 🎯 用/goal管理你的下一个大任务