Codex Skills 实战手册:让 AI 从一次性回答进化为流程稳定的内容搭档
近期,一篇关于 Codex Skills 的整理帖引起了不少关注,我觉得很值得单独拿出来聊聊。
现在很多人用 Codex,仍然停留在比较基础的层面:让它写代码,让它修 bug,让它解释报错,顺便生成一些文档。
单次任务看起来都还行,可真放进连续工作里,马上就会发现它缺少一套“做事的方法”。
比如一个需求直接丢过去,它可能拿起来就写;项目里有什么约定和规范,它多半靠猜;CI 出了问题,得一段一段把日志塞给它;写完以后,它也未必会主动自检,更不会知道怎么把这一次踩过的坑沉淀下来,下次少走弯路。
这正是 Skills 越来越受重视的原因。
我们可以把 Skill 理解成一份提前写好的工作流程说明书。一个 Skill 目录里,通常会有一份 SKILL.md,再配上若干脚本、模板和参考资料。
它会告诉 Codex,面对某类任务应该先看什么、怎么拆解任务、要调用哪些工具、做到什么程度才算结束。
如果说 Prompt 像是临时交代,那 Skill 就更像一套可重复使用、可传承的做事流程。

新手不用全部安装,这几类 Skill 优先用起来就足够
如果你刚开始接触 Codex,别一上来就想把全网仓库都扒一遍,也不用急着把大神推荐的 Skill 统统装齐,其实完全没那个必要。
先盯着官方 openai/skills 仓库来看就够了。
官方仓库里有几类特别值得优先安装。

第一类,规划类。像 create-plan、define-goal 这类 Skill,它们专门解决 Agent 开工前先把头绪理清楚的问题。
真实工作流里,大量返工往往不是代码写得慢,而是一开始就把“做什么”理解偏了。规划类 Skill 的用处,就是先把目标、边界、步骤、验收方式讲清楚,再动手写代码或干活。
这种“先想后做”有时看起来很慢,其实非常节省时间,正所谓磨刀不误砍柴工。
第二类,GitHub 与 CI 类。这里我重点推荐 gh-fix-ci。
官方 gh-fix-ci 的说明很明确:当 GitHub PR 的 checks 挂了,它会用 gh 去查看检查项和日志,整理失败上下文,先给出修复计划,获得明确同意后再修改代码。
这一整套流程就非常贴近真实工程协作的样子。CI 失败最让人烦躁的,正是要在多个 job 之间来回跳、翻日志、定位到底是测试问题、依赖问题、lint 问题还是环境问题。这类脏活特别适合交给 Agent 做第一轮排查,我们只需要判断方案能不能接受就好。
第三类,安全与质量类。例如 security-threat-model、security-best-practices、gh-address-comments。这类 Skill 不一定每天都要用到,但在合并前、上线前、重构前会非常有价值。尤其是 security-threat-model,它要求基于仓库证据去列出资产、边界、入口、攻击路径和缓解方案,能够逼着 Agent 少说泛泛的安全套话,多回到代码和架构本身去思考。
第四类,部署与平台类。官方 curated 里已经可以看到 cloudflare-deploy、netlify-deploy、vercel-deploy、render-deploy 等一系列 Skill。
如果项目经常部署到这些平台,这类 Skill 的回报就特别高——把平台部署流程、常见陷阱和验证步骤固定下来,省下的时间会非常明显。
安装方式其实很直接
先把 Codex 更新到最新:
npm install -g @openai/codex@latest
然后在 Codex 里使用内置 installer 来安装。比如要装 gh-address-comments:
$skill-installer gh-address-comments
如果想装 cloudflare-deploy,也一样:
$skill-installer cloudflare-deploy
如果用到的是 experimental 目录里的 Skill,或者想指向某个具体的 GitHub 目录,也可以直接给路径:
$skill-installer install https://github.com/openai/skills/tree/main/skills/.experimental/create-plan
安装完成之后重启 Codex,新的 Skill 就会生效。

当然,如果使用的是 Codex APP,从页面内安装也是完全一样的体验。

后面使用时不一定要每次都去喊 Skill 的名字。如果 Skill 的描述写得足够清晰,Codex 自己会判断该调用哪一个。例如你可以直接说:帮我看一下这个 PR 的 CI 为什么挂了,先给修复计划,不要直接改代码。正常情况下系统就会自动匹配到 gh-fix-ci,按照那套流程跑下来,你根本不用额外操心。
自媒体人更要善用的 Skill 清单
如果你是自媒体创作者,不必一上来就从零自己写一堆 Skill。官方仓库里其实已经有不少可以直接拿来的东西,特别是处理资料、知识库、素材整理、图片、音频和页面检查时,会很顺手。
比如做资料整理,可以先看 notion-research-documentation 和 notion-knowledge-capture。前者适合把散落在 Notion 里的资料整理成带引用的研究文档,后者适合把聊天记录、会议结论、灵感和决策沉淀成结构化页面。
对于经常写 AI 工具文章的人,这两个可以说非常实用,因为很多选题最初真的只是一堆零散素材:几篇链接、若干截图、评论和临时冒出来的想法。
如果素材里经常包含报告、白皮书或 PDF 教程,可以装 pdf。它擅长阅读、创建和审阅 PDF,尤其是在需要留意版式、截图、页码和排版细节时,比单纯复制文字要可靠得多。比如要写一篇“某份模型报告到底讲了什么”,就可以让它先把 PDF 里适合写进文章的事实、图表和结论系统整理出来。
视频和音频素材,可以看 transcribe 和 speech。transcribe 用来把音频、视频里的讲话转成文字,还支持说话人区分;speech 则负责生成旁白、口播音频或可访问性朗读。做播客整理、视频脚本复盘、访谈摘录、短视频口播,这两项都能无缝接入内容生产流程。
做图和视觉方向,可以先看 screenshot、figma-create-new-file 和 figma-generate-design。screenshot 适合抓取系统或应用截图,figma-create-new-file 可以新建 Figma 文件,figma-generate-design 则能把一个页面、一个产品界面或多段布局转成 Figma 设计。公众号封面、产品功能图解、X 平台的图文卡片,很多时候不需要每次都重新描述一遍审美,只要把比例、主色、留白、标题区和主体区固定下来,就省去大量反复沟通的时间。
如果经常需要检查网页、抓取页面信息或做页面截图,playwright 和 playwright-interactive 同样很实用。比如打算写一篇工具体验文,可以让 Codex 打开官网、走一遍登录后的流程、截几张关键界面、记录每一步的感受,这类工作非常契合浏览器自动化 Skill,让它们先去跑一遍,你再接手优化。
还有一个特别重要的 Skill,就是 skill-creator。它解决的是长期复用的问题,能帮你把自己的工作方法沉淀成新的 Skill。
例如,可以让它帮忙做一个 wechat-writing Skill,里面明确写清楚公众号的开头习惯、段落节奏、禁用词、案例密度和结尾方式;再做一个 topic-research Skill,固定从 GitHub Trending、X 平台、产品 Blog 和官方文档里寻找素材;还可以做一个 content-repurpose Skill,把公众号内容拆解成 X 主帖、thread、社群短帖和短视频口播稿。
以写作 Skill 为例,完全可以把个人风格写进去:开头不要慢慢铺背景,要先给出场景或判断;每个观点后面尽量跟上真实工具、真实案例、真实操作;少用大词,少写空话;写完以后还要检查有没有过度的 AI 味,比如过度工整、转折词太多、读起来像报告总结。
如果你已经有大量个人写作材料,那就直接把材料交给 Codex 去学,效果会更好。
所以自媒体人完全可以先按下面这条链路来走:

notion-research-documentation 负责资料研究; notion-knowledge-capture 负责知识沉淀; pdf 负责报告阅读; transcribe 负责音视频转文字; screenshot / figma-generate-design 负责视觉素材; playwright 负责网页体验; skill-creator 则负责把写作和内容拆解流程固化下来。
我现在也越来越觉得,自媒体人的内容生产,不能只靠灵感。灵感当然重要,但光靠灵感会很累。能长期稳定输出的人,背后往往都靠拢了一套被反复验证过的流程。这套流程跑顺之后,AI 就不再像一个每次都要重新培训的临时工,而是更像一位懂我们创作习惯的内容助理。
写在最后:从聪明回答走向稳定协作
Codex Skills 这件事,表面上是给 Codex 装插件。往深处看,它其实是在把 AI Agent 从一次次的聪明回答,推向一套稳定的协作方式。
单次回答再惊艳,也很难支撑起长期、连续的工作。真正能留下来的,是怎么拆任务、怎么判断输出、怎么调用工具、怎么验证结果,以及怎么把这一次踩的坑,变成下一次可以直接复用的流程。
所以我现在看 AI Agent,已经越来越少只看它某一次回答有多厉害。我更关心的是,它能不能按照既定的流程干活,能不能自己调用对的工具,能不能把经验沉淀好,下次少犯一样的错。
如果这几件事能够成立,Agent 才算真正开始从玩具走向生产力。
Codex Skills 值得反复琢磨,也正是因为它把这条路讲得更具体——模型负责能力上限,Skills 负责把这种能力变成稳定可复制的流程。
别再只让 Codex 裸跑了。无论你是写代码,还是写文章、做图、找资料,都可以从一个最常用的场景开始,先把自己的做事方法提炼成一个 Skill。你会发现,最省时间的地方,正是在下一次遇到同类任务时,你永远不用再从头教它一遍。