Codex Skills 实战手册：让 AI 从一次性回答进化为流程稳定的内容搭档

June 13, 2026

近期，一篇关于 Codex Skills 的整理帖引起了不少关注，我觉得很值得单独拿出来聊聊。

现在很多人用 Codex，仍然停留在比较基础的层面：让它写代码，让它修 bug，让它解释报错，顺便生成一些文档。

单次任务看起来都还行，可真放进连续工作里，马上就会发现它缺少一套“做事的方法”。

比如一个需求直接丢过去，它可能拿起来就写；项目里有什么约定和规范，它多半靠猜；CI 出了问题，得一段一段把日志塞给它；写完以后，它也未必会主动自检，更不会知道怎么把这一次踩过的坑沉淀下来，下次少走弯路。

这正是 Skills 越来越受重视的原因。

我们可以把 Skill 理解成一份提前写好的工作流程说明书。一个 Skill 目录里，通常会有一份 SKILL.md，再配上若干脚本、模板和参考资料。

它会告诉 Codex，面对某类任务应该先看什么、怎么拆解任务、要调用哪些工具、做到什么程度才算结束。

如果说 Prompt 像是临时交代，那 Skill 就更像一套可重复使用、可传承的做事流程。

新手不用全部安装，这几类 Skill 优先用起来就足够

如果你刚开始接触 Codex，别一上来就想把全网仓库都扒一遍，也不用急着把大神推荐的 Skill 统统装齐，其实完全没那个必要。

先盯着官方 openai/skills 仓库来看就够了。

官方仓库里有几类特别值得优先安装。

第一类，规划类。像 create-plan、define-goal 这类 Skill，它们专门解决 Agent 开工前先把头绪理清楚的问题。

真实工作流里，大量返工往往不是代码写得慢，而是一开始就把“做什么”理解偏了。规划类 Skill 的用处，就是先把目标、边界、步骤、验收方式讲清楚，再动手写代码或干活。

这种“先想后做”有时看起来很慢，其实非常节省时间，正所谓磨刀不误砍柴工。

第二类，GitHub 与 CI 类。这里我重点推荐 gh-fix-ci。

官方 gh-fix-ci 的说明很明确：当 GitHub PR 的 checks 挂了，它会用 gh 去查看检查项和日志，整理失败上下文，先给出修复计划，获得明确同意后再修改代码。

这一整套流程就非常贴近真实工程协作的样子。CI 失败最让人烦躁的，正是要在多个 job 之间来回跳、翻日志、定位到底是测试问题、依赖问题、lint 问题还是环境问题。这类脏活特别适合交给 Agent 做第一轮排查，我们只需要判断方案能不能接受就好。

第三类，安全与质量类。例如 security-threat-model、security-best-practices、gh-address-comments。这类 Skill 不一定每天都要用到，但在合并前、上线前、重构前会非常有价值。尤其是 security-threat-model，它要求基于仓库证据去列出资产、边界、入口、攻击路径和缓解方案，能够逼着 Agent 少说泛泛的安全套话，多回到代码和架构本身去思考。

第四类，部署与平台类。官方 curated 里已经可以看到 cloudflare-deploy、netlify-deploy、vercel-deploy、render-deploy 等一系列 Skill。

如果项目经常部署到这些平台，这类 Skill 的回报就特别高——把平台部署流程、常见陷阱和验证步骤固定下来，省下的时间会非常明显。

安装方式其实很直接

先把 Codex 更新到最新：

npm install -g @openai/codex@latest

然后在 Codex 里使用内置 installer 来安装。比如要装 gh-address-comments：

$skill-installer gh-address-comments

如果想装 cloudflare-deploy，也一样：

$skill-installer cloudflare-deploy

如果用到的是 experimental 目录里的 Skill，或者想指向某个具体的 GitHub 目录，也可以直接给路径：

$skill-installer install https://github.com/openai/skills/tree/main/skills/.experimental/create-plan

安装完成之后重启 Codex，新的 Skill 就会生效。

当然，如果使用的是 Codex APP，从页面内安装也是完全一样的体验。

后面使用时不一定要每次都去喊 Skill 的名字。如果 Skill 的描述写得足够清晰，Codex 自己会判断该调用哪一个。例如你可以直接说：帮我看一下这个 PR 的 CI 为什么挂了，先给修复计划，不要直接改代码。正常情况下系统就会自动匹配到 gh-fix-ci，按照那套流程跑下来，你根本不用额外操心。

自媒体人更要善用的 Skill 清单

如果你是自媒体创作者，不必一上来就从零自己写一堆 Skill。官方仓库里其实已经有不少可以直接拿来的东西，特别是处理资料、知识库、素材整理、图片、音频和页面检查时，会很顺手。

比如做资料整理，可以先看 notion-research-documentation 和 notion-knowledge-capture。前者适合把散落在 Notion 里的资料整理成带引用的研究文档，后者适合把聊天记录、会议结论、灵感和决策沉淀成结构化页面。

对于经常写 AI 工具文章的人，这两个可以说非常实用，因为很多选题最初真的只是一堆零散素材：几篇链接、若干截图、评论和临时冒出来的想法。

如果素材里经常包含报告、白皮书或 PDF 教程，可以装 pdf。它擅长阅读、创建和审阅 PDF，尤其是在需要留意版式、截图、页码和排版细节时，比单纯复制文字要可靠得多。比如要写一篇“某份模型报告到底讲了什么”，就可以让它先把 PDF 里适合写进文章的事实、图表和结论系统整理出来。

视频和音频素材，可以看 transcribe 和 speech。transcribe 用来把音频、视频里的讲话转成文字，还支持说话人区分；speech 则负责生成旁白、口播音频或可访问性朗读。做播客整理、视频脚本复盘、访谈摘录、短视频口播，这两项都能无缝接入内容生产流程。

做图和视觉方向，可以先看 screenshot、figma-create-new-file 和 figma-generate-design。screenshot 适合抓取系统或应用截图，figma-create-new-file 可以新建 Figma 文件，figma-generate-design 则能把一个页面、一个产品界面或多段布局转成 Figma 设计。公众号封面、产品功能图解、X 平台的图文卡片，很多时候不需要每次都重新描述一遍审美，只要把比例、主色、留白、标题区和主体区固定下来，就省去大量反复沟通的时间。

如果经常需要检查网页、抓取页面信息或做页面截图，playwright 和 playwright-interactive 同样很实用。比如打算写一篇工具体验文，可以让 Codex 打开官网、走一遍登录后的流程、截几张关键界面、记录每一步的感受，这类工作非常契合浏览器自动化 Skill，让它们先去跑一遍，你再接手优化。

还有一个特别重要的 Skill，就是 skill-creator。它解决的是长期复用的问题，能帮你把自己的工作方法沉淀成新的 Skill。

例如，可以让它帮忙做一个 wechat-writing Skill，里面明确写清楚公众号的开头习惯、段落节奏、禁用词、案例密度和结尾方式；再做一个 topic-research Skill，固定从 GitHub Trending、X 平台、产品 Blog 和官方文档里寻找素材；还可以做一个 content-repurpose Skill，把公众号内容拆解成 X 主帖、thread、社群短帖和短视频口播稿。

以写作 Skill 为例，完全可以把个人风格写进去：开头不要慢慢铺背景，要先给出场景或判断；每个观点后面尽量跟上真实工具、真实案例、真实操作；少用大词，少写空话；写完以后还要检查有没有过度的 AI 味，比如过度工整、转折词太多、读起来像报告总结。

如果你已经有大量个人写作材料，那就直接把材料交给 Codex 去学，效果会更好。

所以自媒体人完全可以先按下面这条链路来走：

notion-research-documentation 负责资料研究； notion-knowledge-capture 负责知识沉淀； pdf 负责报告阅读； transcribe 负责音视频转文字； screenshot / figma-generate-design 负责视觉素材； playwright 负责网页体验； skill-creator 则负责把写作和内容拆解流程固化下来。

我现在也越来越觉得，自媒体人的内容生产，不能只靠灵感。灵感当然重要，但光靠灵感会很累。能长期稳定输出的人，背后往往都靠拢了一套被反复验证过的流程。这套流程跑顺之后，AI 就不再像一个每次都要重新培训的临时工，而是更像一位懂我们创作习惯的内容助理。

写在最后：从聪明回答走向稳定协作

Codex Skills 这件事，表面上是给 Codex 装插件。往深处看，它其实是在把 AI Agent 从一次次的聪明回答，推向一套稳定的协作方式。

单次回答再惊艳，也很难支撑起长期、连续的工作。真正能留下来的，是怎么拆任务、怎么判断输出、怎么调用工具、怎么验证结果，以及怎么把这一次踩的坑，变成下一次可以直接复用的流程。

所以我现在看 AI Agent，已经越来越少只看它某一次回答有多厉害。我更关心的是，它能不能按照既定的流程干活，能不能自己调用对的工具，能不能把经验沉淀好，下次少犯一样的错。

如果这几件事能够成立，Agent 才算真正开始从玩具走向生产力。

Codex Skills 值得反复琢磨，也正是因为它把这条路讲得更具体——模型负责能力上限，Skills 负责把这种能力变成稳定可复制的流程。

别再只让 Codex 裸跑了。无论你是写代码，还是写文章、做图、找资料，都可以从一个最常用的场景开始，先把自己的做事方法提炼成一个 Skill。你会发现，最省时间的地方，正是在下一次遇到同类任务时，你永远不用再从头教它一遍。