2026最新Codex高级提示模板30例:效率翻倍,覆盖全流程实战
越来越多的开发者发现,同样使用 Codex,有人一句 prompt 就能搞定整个模块,而有人却需要反复拉扯、效率极低。差距就在于提示词的组织方式。本文依据 OpenAI 官方 Codex Prompting Guide 以及社区公认的实践经验,提炼出 30 套经过严格验证的高级 Prompt 模板,完整覆盖项目初始化、代码审查、调试、重构、部署等全流程环节,真正做到复制即可使用,助你告别低效沟通。
核心概念速览
Codex Prompt 四要素
OpenAI 官方建议,每个 Prompt 都应当包含以下四个关键部分:
| 要素 | 说明 | 示例 |
|---|---|---|
| 目标(Goal) | 一句话概括你要完成什么任务 | “为订单表单添加实时校验逻辑” |
| 上下文(Context) | 指定涉及的文件、目录、文档或错误信息 | “相关文件:src/components/OrderForm.tsx” |
| 约束(Constraints) | 明确不能触碰的边界以及必须遵守的规范 | “不引入新依赖,保持与现有 API 签名兼容” |
| 完成条件(Done when) | 如何验证任务已正确完成 | “所有单元测试通过,构建无错误” |
Codex vs Claude Code 快速对比
| 特性 | Codex | Claude Code |
|---|---|---|
| 配置文件 | AGENTS.md + config.toml |
CLAUDE.md + settings.json |
| 技能系统 | .agents/skills/SKILL.md |
.claude/skills/*.md |
| 子代理 | .codex/agents/*.toml |
Agent Team 模式 |
| Hook 系统 | .codex/hooks.json |
.claude/settings.json |
| 规划模式 | /plan 或 Shift+Tab |
/plan |
| 代码审查 | /review |
代码审查 Agent |
| 分支隔离 | Git Worktree | Worktree |
| 推理强度 | low / medium / high / xhigh | 无(自动调节) |
如何使用本文?
根据你当前的工作任务,找到对应的分类,直接复制模板,将 [方括号] 中的占位内容替换为自己项目的实际情况即可。
第一组:项目启动与初始化模板
在真正动手编码前,先用这些 Prompt 打好坚实基础。
模板 1:项目快速上手
适用场景:刚接手一个陌生项目,需要迅速理清代码结构
你是一位资深工程师,刚刚加入这个项目。
请完成以下分析:
1. 梳理项目结构:标识核心目录、技术栈、构建及测试命令
2. 定位配置文件(数据库、环境变量、CI/CD)
3. 找到入口文件以及主要业务逻辑所在路径
4. 制定一份 30 分钟的上手学习计划
使用 rg 进行文件搜索,通过 read_file 并行读取关键配置。
如信息不足,最多提出 3 个澄清问题。
Codex 进阶技巧:你可以用 @文件名 来定向指定上下文,例如 @package.json @tsconfig.json 分析技术栈。
模板 2:AGENTS.md 初始化
适用场景:新项目还没有 AGENTS.md,需要建立项目级指引
为当前项目创建一份高质量的 AGENTS.md 文件。
参照 Codex 最佳实践,至少包含:
1. 项目简介与技术栈说明
2. 目录结构介绍
3. 常用命令(构建、测试、部署、检查)
4. 代码规范(命名约定、文件组织方式)
5. PR 要求与审查标准
6. 已知的技术债务与常见陷阱
先解析项目结构,再输出 AGENTS.md 草稿。
我会审核后再决定是否写入文件。
保持精简——只写对 Codex 有实际指导意义的信息,总长度控制在 150 行内。
提示:也可以在 Codex CLI 中直接运行 /init 命令自动生成骨架,再基于它进行调整。
模板 3:技术栈与依赖分析
适用场景:评估项目的技术选型及依赖健康状态
分析该项目技术栈,输出一份评估报告:
1. **技术栈清单**:语言、框架、数据库、中间件
2. **版本状况**:哪些依赖已过时?是否存在已知安全漏洞?
3. **架构模式**:采用了哪种架构风格(MVC/整洁/六边形等)
4. **依赖关系图**:核心模块之间的相互引用情况
5. **优先级改进项**:列出前 3 个最值得修复的问题,按紧迫度排序
聚焦在安全性、可维护性、性能瓶颈。
使用 rg 搜索依赖声明文件(package.json、pom.xml、requirements.txt 等)。
模板 4:Git 历史考古
适用场景:理解项目演进历程与过往的设计决策
分析当前项目的 Git 历史:
1. **提交热点**:哪些文件修改最频繁?
2. **近期趋势**:最近 30 天的主要变更方向是什么?
3. **设计推理**:从 commit message 推测关键的设计决策
4. **代码分布**:代码主要集中在哪些模块?
5. **风险区域**:经常出现修复(fix)提交的文件,可能是潜在风险点
输出一份简洁的项目健康评估报告。
模板 5:测试覆盖率摸底
适用场景:评估项目测试现状
全面审查该项目的测试情况:
1. **测试框架**:使用了什么测试工具?运行命令是什么?
2. **覆盖率水平**:当前整体覆盖率约多少?哪些模块覆盖率最低?
3. **测试质量**:测试主要是单元测试还是更偏向集成测试?
4. **关键缺失**:哪些核心业务逻辑完全没有自动化测试?
5. **补充优先级**:列出最需要补写测试的 5 个文件
据此输出一份测试改进计划,并按优先级排序。
第二组:代码审查与质量保障模板
让 Codex 扮演专业级的 Code Reviewer。
模板 6:安全审查
适用场景:上线前的安全检查,或处理敏感数据的代码
对当前代码进行全方位安全审查,重点检查:
- **认证与授权**:访问控制链、权限边界是否严密
- **注入攻击**:SQL注入、命令注入、模板注入、反序列化风险
- **SSRF**:URL获取机制、白名单、网络出口控制
- **XSS**:输出转义、数据清洗
- **敏感信息泄露**:硬编码密钥、日志中可能暴露的敏感数据
输出格式:
- 严重程度(高危/中危/低危)
- 具体位置(文件:行号)
- 攻击场景描述
- 修复建议及代码示例
按严重程度排序,只报告真实存在的问题,不做无意义的吹毛求疵。
模板 7:性能分析
适用场景:页面加载慢、接口响应延迟、内存占用高
分析 [具体模块/页面/API] 的性能问题:
1. **定位瓶颈**:找出执行时间最长的代码路径
2. **排名优化建议**:列出 3 条优化措施,按影响程度排序
3. **每条优化项应包含**:
- 需要修改的文件及函数
- 预期性能提升和潜在风险
- 优化前后的对比基准测试方案
注意:不做无实际收益的微优化,只聚焦能带来明显体验提升的改动。
先输出分析报告供我确认,再执行修改。
模板 8:代码异味检测
适用场景:代码能跑但质量不佳,希望系统性改善
扫描以下文件/目录,识别代码异味:
- 过长函数(超过 50 行)
- 深层嵌套(超过 3 层 if/for)
- 重复代码(相似度 > 80% 的代码块)
- 魔法数字(未命名的字面常量)
- 过度耦合(一个类依赖过多其他类)
- 死代码(从未被引用的函数和变量)
对每个问题提供:
- 准确位置
- 问题描述
- 建议的重构方式
只报告真正值得改善的地方,不要过度诊断。
模板 9:PR 描述与 Code Review
适用场景:准备提交 PR,或需要审查代码变更
基于当前分支的所有改动,生成一份 PR 描述,包含:
- **背景**:解决了什么问题?影响了哪些用户或流程?
- **方案**:改了什么?为什么选择这个方案?
- **关键文件**:建议 Reviewer 重点审查哪些文件?
- **测试结果**:执行了哪些测试?结果如何?
- **风险提示**:合并后可能出现什么问题?
描述务必简洁,让 Reviewer 在 30 秒内掌握核心信息。
Codex 专属:也可以直接使用 /review 命令,它支持按基础分支对比审查、审查暂未提交的变更、审查指定 commit。
模板 10:依赖升级计划
适用场景:需要升级某个依赖,但担心引入破坏性变更
制定将 [依赖名] 从 [当前版本] 升级到 [目标版本] 的详细计划:
1. **破坏性变更**:查阅 release notes,列出所有 breaking changes
2. **影响范围评估**:这些变更会触及到项目中的哪些代码?
3. **分步执行计划**:
- 第一步:升级并修复编译错误
- 第二步:修复运行时错误
- 第三步:运行完整测试套件
- 第四步:回归验证
4. **回滚方案**:如果升级失败,如何安全回退?
先输出计划并确认,再逐步执行。
第三组:调试与错误修复模板
当遇到棘手 Bug 时,这套模板能让 Codex 高效定位根因。
模板 11:系统性 Bug 排查
适用场景:面对复杂 Bug,完全不清楚问题根源在哪
系统化排查以下 Bug:
**现象**:[描述 Bug 的具体表现]
排查步骤:
1. **复现**:找出最小复现路径
2. **定位**:从入口开始跟踪代码执行流程,找到第一个出现异常的地方
3. **根因分析**:解释为什么会出现这个异常
4. **修复方案**:提供改动最小的修复方式
5. **验证**:编写一个测试用例防止未来回归
约束:
- 每一步都要有日志或证据支撑,不做无端猜测
- 不做多处同步修改
- 确认根因后再着手修复
- 不要用 broad try/catch 掩盖错误
Codex 官方建议:让 Codex 自己运行终端命令并观察日志输出,不要手动替它归纳。可以要求 Codex 使用 run_terminal_cmd 将服务作为后台任务启动,进行实时调试。
模板 12:测试修复循环
适用场景:CI 构建失败,需要快速修复失败的测试
运行测试套件。
对于每一个失败的测试:
1. 解释失败原因
2. 提出最安全的改动方案
3. 展示如何验证修复(测试命令及预期输出)
原则:
- 优先修复测试代码,而非直接跳过用例
- 先输出修复计划,不要直接修改
- 修复后重新运行全部测试,确保无副作用
- 不要添加宽泛的 try/catch 或静默回退
模板 13:日志分析
适用场景:线上出现问题,需要从日志中快速定位
分析以下日志,定位根本原因:
[粘贴日志内容]
分析要求:
1. **错误分类**:这属于哪种错误?(网络/数据库/权限/超时/代码缺陷)
2. **事件时间线**:按时序梳理关键事件链
3. **根因推断**:最可能的根本原因是什么?
4. **影响范围**:波及了哪些功能 / 用户?
5. **紧急止血方案**:现在可以立即做什么来缓解?
6. **长期修复建议**:如何避免再次发生?
注意严格区分“症状”与“病因”。
模板 14:兼容性修复
适用场景:代码在特定环境 / 浏览器 / 系统上无法运行
排查兼容性问题:
**目标环境**:[操作系统/浏览器/Node版本/Python版本等]
**现象描述**:[具体异常]
排查方向:
1. **版本差异**:目标环境与开发环境之间存在哪些版本差异?
2. **平台相关调用**:是否使用了平台特有的 API?
3. **编码问题**:涉及文件路径、字符编码等平台差异吗?
4. **依赖兼容性**:依赖库是否明确支持目标环境?
给出兼容性修复方案,确保不破坏现有环境的正常运行。
模板 15:竞态条件排查
适用场景:偶发性 Bug,时好时坏,怀疑是并发问题
排查可能存在的并发问题:
**现象**:[描述偶发性 Bug]
**触发规律**:[在什么情况下更容易复现]
排查清单:
1. **共享状态**:是否有多个线程/协程不加保护地访问同一变量?
2. **竞态条件**:是否存在 check-then-act 模式?
3. **死锁风险**:多个锁的获取顺序是否一致?
4. **资源泄露**:连接、文件句柄是否正确释放?
5. **时序假设**:逻辑是否依赖于特定的执行顺序?
若确认是并发问题,请给出线程安全的修复方案。
第四组:代码重构与优化模板
让代码变得更好,而不是变多。
模板 16:安全重构
适用场景:需要对代码进行重构,但必须保证功能不受影响
重构 [文件/模块名] 以提升可读性和可维护性。
安全重构流程:
1. **先写特征测试**:用测试锁定当前行为(不改变行为)
2. **运行测试确认通过**
3. **小步重构**:每次只做一个小改动,每步都运行测试
4. **记录步骤**:每一步都要说明改了什么、为什么这样改
5. **行为对比**:重构前后测试结果必须完全一致
约束:
- 不改变任何外部可观察的行为
- 不删除任何公开 API
- 不添加宽泛的 try/catch 或成功假象回退
- 如果不确定某个改动是否安全,停下来询问
- 使用 apply_patch 执行编辑,批量逻辑修改避免多次碎片化 patch
模板 17:API 设计审查
适用场景:设计新 API 或审查现有接口
审查 [模块/API] 的接口设计:
1. **一致性**:命名风格是否统一?错误处理模式是否一致?
2. **RESTful 规范**:是否遵循 REST 最佳实践?
3. **向后兼容**:对现有客户端是否会产生影响?
4. **安全性**:认证、授权、输入校验是否到位?
5. **文档**:是否提供了完整的 API 文档?
针对每一项给出:
- 当前状态
- 改进建议
- 改进后的示例代码
输出一份 API 优化方案。
模板 18:死代码清理
适用场景:项目日渐臃肿,需要清理不再使用的代码
扫描项目,找出所有可能存在的死代码:
1. **孤立导出项**:被 export 但从未被 import 的函数/类/变量
2. **冗余依赖**:package.json 中声明但代码中未实际使用的包
3. **孤立文件**:没有任何其他文件引用的独立文件
4. **注释掉的大段代码**(超过 3 行)
5. **失效配置**:已不起作用的配置项
每项均提供:
- 文件路径
- 最后使用时间(从 git 历史推断)
- 删除风险评估(安全/需确认/有风险)
先输出清理计划,我确认后再执行删除。
模板 19:函数拆分
适用场景:函数过长或职责混杂,需要拆分
分析 [文件路径] 中的长函数,进行合理拆分:
1. **识别**:找出所有超过 50 行的函数
2. **职责分析**:每个函数实际做了几件不同的事?是否有清晰的职责边界?
3. **拆分方案**:提出拆分方案,每个新函数只做一件事
4. **命名**:为每个新函数起一个精确描述其职责的名称
5. **行为验证**:确保拆分后外部行为完全不变
遵循单一职责原则。
先输出拆分方案供我审阅,确认后再实施。
模板 20:自动化脚本生成
适用场景:有重复的手动操作流程,希望转为自动化脚本
将以下手动操作流程转换为自动化脚本:
**当前流程**:
[描述手动步骤]
脚本要求:
- 支持 --dry-run 模式(仅展示会做什么,不实际执行)
- 输出清晰,每一步都打印当前操作说明
- 安全的错误处理,失败时给出可操作的建议
- 幂等性设计,重复运行不会导致错误
- 包含使用帮助(--help)
使用 Shell 或 Python 实现,选择项目技术栈中最适宜的语言。
第五组:功能开发全流程模板
覆盖从需求到上线的完整开发周期。
模板 21:端到端功能实现
适用场景:开发一个完整功能,涵盖数据库到前端
实现 [功能描述]。
开发流程:
1. **需求澄清**:先列出需要确认的问题,不要直接开始写代码
2. **设计阶段**:
- 数据模型:表结构、字段、约束及迁移脚本
- API 设计:端点、请求/响应格式、认证方式、错误码
- 前端界面:页面结构、状态管理、表单校验、空态与加载态
3. **实现顺序**:按数据层 → 服务层 → 控制层 → 前端的顺序开发
4. **测试**:编写单元测试和集成测试
5. **验证**:运行完整测试套件,确保无回归
约束:
- 遵循现有代码库的命名和代码风格
- 不引入不必要的新依赖
- 保持 diff 小且易于审查
- 确保行为安全,不影响现有功能
- 先输出设计方案,确认后再动手实现
Codex 推理强度建议:对于这类复杂任务,建议使用 high 或 xhigh 推理强度(在 config.toml 中设置,或通过 /model 切换)。
模板 22:数据库迁移
适用场景:需要调整数据库结构
设计数据库迁移方案:
**需求**:[描述需要哪些数据变更]
方案要求:
1. **迁移脚本**:提供 up 和 down 两个方向的 SQL
2. **数据安全**:若有数据转换,确保零丢失
3. **回滚计划**:迁移出问题时如何安全回退?
4. **性能影响**:对大表操作是否会锁表?是否需要分批处理?
5. **兼容性**:迁移过程中新旧代码是否能同时正常运行?
约束:
- 迁移脚本必须可逆(含 down 脚本)
- 先在测试环境验证
- 对大表操作采用分批处理策略
模板 23:可观测性增强
适用场景:为关键路径添加日志、指标和链路追踪
为 [具体模块/接口] 添加可观测性支持:
1. **结构化日志**:在关键节点记录 request_id、耗时、状态等信息
2. **指标埋点**:添加计数器(QPS)、直方图(延迟)、仪表盘(并发数)
3. **链路追踪**:在跨服务调用点传递 trace_id
4. **告警规则**:定义阈值以及通知方式
约束:
- 日志中绝对不能包含 PII(个人身份信息)
- 埋点开销控制在 1ms 以内,不影响正常性能
- 提供具体的插入点位置和示例代码
模板 24:CI/CD 流水线配置
适用场景:搭建或优化持续集成/部署流水线
为该项目设计 CI/CD 流水线:
1. **构建阶段**:编译、打包、镜像构建
2. **测试阶段**:单元测试、集成测试、端到端测试
3. **安全扫描**:依赖漏洞扫描、代码安全扫描
4. **部署阶段**:开发 → 预发 → 生产的分步部署策略
5. **回滚机制**:发生问题时的一键回滚方式
要求:
- 流水线总执行时间控制在 10 分钟以内
- 失败时提供清晰且可操作的错误信息
- 支持手动审批节点
模板 25:Headless 批量任务
适用场景:需要对多个文件 / 模块进行相同的修改
使用 Codex 的 headless 模式批量执行任务:
**任务**:[描述在每个文件上需要执行的修改]
执行方式:
```bash
# 针对每个目标文件启动独立的 Codex 实例
for file in $(find . -name "*.ts" -path "*/src/*"); do
codex exec -p "在 $file 中:[具体修改指令]" &
done
wait
优势:
- 每个文件独立执行,互不影响
- 并行处理,整体速度更快
- 上下文隔离,不会相互干扰
执行完毕后,汇总所有变更让我确认。
第六组:高级玩法与效率提升模板
掌握这些,你就是 Codex 的高阶玩家。
模板 26:多 Agent 并行审查
适用场景:对代码变更进行多维度、高强度的审查
启动多个并行子 Agent 对当前变更进行审查:
1. **Bug 检测 Agent**:检查逻辑错误和边界条件
2. **安全审查 Agent**:检查注入、XSS、认证等安全问题
3. **性能审查 Agent**:检查性能瓶颈和不必要计算
4. **测试覆盖 Agent**:检查测试是否充分
5. **API 兼容性 Agent**:检查是否破坏了现有接口
6. **依赖审查 Agent**:检查新增依赖是否合理
每个 Agent 独立运行,最后汇总成一份按优先级排序的综合审查报告。
Codex 实现:在 .codex/agents/ 目录下创建专门的 Agent 配置文件(如 reviewer.toml),为每个 Agent 设定独立的角色和 Skill。Codex 的多 Agent 系统默认开启,天然支持并行 fan-out 作业。
模板 27:Worktree 隔离开发
适用场景:同时开发多个功能,保持环境完全隔离
使用 Git Worktree 进行隔离式开发:
1. 在 Codex App 中为功能创建 worktree:
Automations → 选择在独立 worktree 中运行
2. 或通过命令行操作:
git worktree add ../feature-auth feature/auth
3. 在独立环境中启动开发:
cd ../feature-auth
codex # 在新目录中启动 Codex
4. 完成后合并:
git checkout main
git merge feature/auth
git worktree remove ../feature-auth
好处:
- 多个功能并行开发,完全互不干扰
- 每个 worktree 拥有独立的 Codex 会话与上下文
- 避免上下文污染
现在,请为我创建一个 worktree,用于开发 [功能描述]。
模板 28:上下文管理策略
适用场景:长时间开发会话,上下文开始混乱,需要重整
执行上下文管理:
1. **检查当前状态**:运行 /status 查看会话状况
2. **清理策略**(视情况选择):
**简单重启**:
/compact 让 Codex 自动压缩历史上下文
或使用 /fork 创建新线程进行探索,不丢失原有上下文
**复杂重启**:
- 让 Codex 将当前计划和进度写入文件
- 开启新会话,读取该进度文件继续工作
3. **预防措施**:
- 一个任务一个线程,避免把所有事塞进一个会话
- 不相关的任务用 /fork 或新会话处理
- 将重要决策记录到 AGENTS.md
- 利用子 Agent 处理探索性任务,保持主线程清爽
Codex 优势:Codex 拥有一流的 Compaction(上下文压缩)能力,能在不丢失关键信息的前提下压缩历史,支持持续数小时的连贯对话。
模板 29:Hook 自动化
适用场景:在提交代码时自动执行质量检查,防止 AI 引入低级错误
配置 Codex Hooks 实现自动化检查。
在 .codex/config.toml 中启用 hooks 支持,然后在 .codex/hooks.json 中配置:
{
"hooks": {
"PostToolUse": [
{
"matcher": "shell_command(git commit*)",
"command": "bash .codex/hooks/pre-commit-check.sh"
}
]
}
}
pre-commit-check.sh 的逻辑:
1. 运行 lint 检查,失败则阻止提交
2. 运行测试,失败则阻止提交
3. 检查是否误改了不该动的文件(如 .env、migrations/)
4. 搜索是否存在调试代码(console.log、print 等)
如此一来,Codex 每次提交都会自动通过这些检查,未通过则进入“测试-修复”迭代,直到干净为止。
注意:Codex Hooks 需要启用 codex_hooks = true 功能标志,在 config.toml 中开启。
模板 30:自定义 Skill 创建
适用场景:将常用 Prompt 封装成可复用的 Skill,提升团队整体效率
创建一个自定义 Skill,用于 [具体用途]。
Codex Skill 文件结构:
.agents/skills/[skill-name]/SKILL.md
Skill 模板:
---
name: [skill-name]
description: 用一句话描述这个 Skill 做什么以及何时触发
---
# [Skill 名称]
## 触发条件
在什么情况下应该使用这个 Skill。
## 执行步骤
1. 第一步:...
2. 第二步:...
## 约束
- 不要做什么
- 必须做什么
## 验证方式
如何确认任务已完成。
## 常见陷阱
- 这个 Skill 容易犯的错误 1
- 这个 Skill 容易犯的错误 2
现在请帮助我创建一个满足 [描述你的需求] 的 Skill。
Codex Skill 最佳实践:
description是给模型看的触发条件,不是摘要,要明确“什么时候该用我”- Skill 应该是一个文件夹,利用
references/、scripts/、examples/子目录做渐进式信息加载 - 每个 Skill 都需包含“常见陷阱”部分,记录已知的失败模式
- 不要给 Codex 写死步骤,只需明确目标和约束
Prompt 黄金法则
掌握这 30 个模板后,牢记以下 5 条 Codex 专属法则,将让你的效率更上一层:
法则 1:先规划,后执行
使用 /plan 让 Codex 先产出方案,得到确认后再动手。复杂任务切忌跳过规划阶段。
/plan
实现用户权限管理模块,需要支持 RBAC 模型
法则 2:约束比空泛指导更有效
告诉 Codex 不能做什么,比告诉它“要写好代码”有效得多。
❌ "请写高质量代码"
✅ "不引入新依赖,不修改公开 API,不跳过任何测试,不使用 broad try/catch"
法则 3:验证是必选项
每个 Prompt 都要包含完成条件——运行什么命令、预期输出是什么。Codex 可以自行完成验证循环,前提是你提供清晰的验证标准。
法则 4:善用推理强度调节
根据任务难度选择合适的推理等级:
| 推理强度 | 适用场景 | 速度 |
|---|---|---|
| low | 简单、范围明确的任务 | 最快 |
| medium | 日常编码,平衡智能与速度 | 推荐 |
| high | 复杂变更、深度调试 | 较慢 |
| xhigh | 长时间自主推理任务 | 最慢但最强 |
法则 5:将重复工作沉淀为 Skill
如果一个 Prompt 你已经使用了两次以上,就应当将它封装为 Skill。当某个工作流趋向稳定,就应该升级为自动化。
渐进式演进路径:
手动 Prompt → 可复用 Skill → 自动化 Automation
常见问题答疑
Q1:Codex 和 Claude Code 的 Prompt 能通用吗?
大部分通用。核心四要素(目标、上下文、约束、完成条件)是相通的。但 Codex 的特色功能(如推理强度调节、/review 命令、Skill 体系)与 Claude Code 的差异点(Hooks 系统、Agent Team)需要针对性调整。
Q2:为什么我的 Codex Prompt 效果不尽人意?
最常见的三个原因:
- 缺少完成条件:Codex 不清楚“做完”的定义
- 范围太大:一个 Prompt 塞进过多诉求
- 未利用 AGENTS.md:应当把项目规范写入 AGENTS.md,而不是每次在 Prompt 中重复
Q3:AGENTS.md 应该写什么?
遵循“150 行原则”:简洁、实用、源于真实摩擦。应包含:项目结构、常用命令、代码规范、已知问题。不要堆砌冗长规则,仅在 Codex 重复犯下相同错误时才追加新条目。
Q4:怎么选择推理强度?
- 不确定时就用 medium,这是 Codex 官方推荐的默认值
- 简单任务用 low:例如修改 CSS、编写工具函数
- 复杂架构变更选 high:如模块重构、跨文件修改
- 长时间自主任务用 xhigh:让 Codex 独立完成完整功能
Q5:Codex 犯了错怎么办?
不要直接手动修正,而是:
- 让 Codex 自己做一次回顾(retrospective)
- 将所学到的教训写入 AGENTS.md
- 如果是反复出现的问题,封装到 Skill 的“常见陷阱”板块
速查表
| 场景 | 推荐模板编号 | 核心关键词 |
|---|---|---|
| 接手新项目 | 1, 2 | 仓库分析、AGENTS.md |
| 上线前检查 | 6, 9 | 安全审查、PR 描述 |
| 修 Bug | 11, 12, 13 | 根因分析、测试修复、日志 |
| 代码重构 | 16, 18, 19 | 安全重构、死代码清理、函数拆分 |
| 开发新功能 | 21, 22, 23 | 端到端、数据库迁移、可观测性 |
| 性能优化 | 7, 23 | 性能分析、监控 |
| 团队协作 | 25, 26, 27 | 批量任务、并行审查、Worktree |
| 长时间开发 | 28, 29, 30 | 上下文管理、Hook、Skill |