十大Agent神级技能实战指南:从TDD到UI设计,程序员提效必备
上一次我们系统聊了 Agent Skills 是什么、怎么用,以及和 Prompt / MCP 的区别。今天直接上干货,分享 10 个真正值得程序员装上的 Skills,覆盖开发流程、代码审查、UI 设计、网页操作、前端验收、MCP 开发、API 接入等高频场景:
- 让 AI 自动走完整 TDD 流程,测试先行,实现在后
- 把模糊输入变成 PRD、技术方案或决策文档
- 一键生成符合行业特色的完整设计系统
- 从 SOLID、安全性、性能等多维度做专业代码审查
- 解决长对话中上下文“腐烂”的失忆问题
- 为 AI 配上真实的浏览器操控和自动浏览能力
- 用 Playwright 对本地 Web 应用进行交互验收与截图检查
- 辅助开发 MCP Server,将内部 API 封装成 Agent 工具
- 在编写 Claude API 应用时查 SDK、流式、工具调用、缓存和模型迁移细节
接下来按场景逐一展开。
Superpowers
如果你只是偶尔让 AI 补一行代码,Superpowers 可能看起来有些笨重。但当你把 Claude Code、Cursor 这一类工具真正嵌入日常开发后,一个现实问题立刻浮现:AI 可以写代码,但并不会自动遵守工程流程。
需求还没有澄清就动手,测试还没跑就说“完成”,改到一半把主分支搞乱,或者实现后只检查语法而不管设计是否跑偏。Superpowers 要解决的正是这些。
它把需求澄清、方案拆分、Git Worktree、TDD、代码审查、调试和完成验证打包成一套 Skills,让 AI 在每个阶段都按固定步骤推进,避免你在 Prompt 里一遍遍提醒。
内置主要技能:
| 技能名称 | 触发方式 | 核心能力 |
|---|---|---|
| brainstorming | 命令 /superpowers:brainstorm | 先追问目标、约束和边界,再整理成设计文档 |
| using-git-worktrees | 自动(设计确认后) | 为每个任务独立开 Git worktree,隔离当前分支干扰 |
| writing-plans | 自动(设计确认后) | 把设计拆成 2–5 分钟粒度的小任务,写明文件、改法与验证方式 |
| executing-plans | 自动(执行计划时可选) | 适合批量重复任务,按计划逐项推进 |
| test-driven-development | 自动(代码实现阶段) | 按红-绿-重构节奏,先补充测试,再补实现 |
| subagent-driven-development | 自动(执行计划时可选) | 给任务分配独立子 Agent,完成后二次检查设计符合度和代码质量 |
| code-review | 自动(任务完成后) | 在代码合入前做第二轮质量检查 |
| systematic-debugging | 需要时触发 | 按阶段定位问题来源,避免边猜边改 |
| verification-before-completion | 自动(宣称完成时) | 没有测试、日志或命令输出,就不允许宣布完成 |
我最看重的是 verification-before-completion 和 test-driven-development。很多 AI 编程翻车症结就在验证:模型改完了代码,测试、日志、命令输出却没跟上。Superpowers 直接把验证变成流程硬约束:没有证据,就不能收工。
目前 Superpowers 支持 Claude Code、Cursor、Codex、OpenCode 等主流 AI 编程工具。下面以 Claude Code 为例。
如果你还没有 Claude Code,先确保本机有 Node.js 18+,然后执行:
npm install -g @anthropic-ai/claude-code
在 Claude Code 里添加插件市场:
/plugin marketplace add obra/superpowers-marketplace
安装 Superpowers:
/plugin install superpowers@superpowers-marketplace
共有三个下载选项:

Superpowers 下载
| 选项 | 作用范围 |
|---|---|
| Install for you (user scope) | 全局生效,电脑上任何地方启动 Claude Code 都能调用 |
| Install for all collaborators (project scope) | 项目成员共享,配置写入项目文件,同事拉代码即可用 |
| Install for you, in this repo only (local scope) | 仅限当前文件夹,换目录即失效 |
更推荐 User Scope。Superpowers 管理的是通用开发流程,并不依赖某个具体项目。全局安装后,无论打开 Java、前端还是临时脚本目录,都能直接使用同一套工作流。
安装完毕后,用 /plugin 或 /plugin list 查看列表,确认 Superpowers 已生效。
项目地址:https://github.com/obra/superpowers
Everything Claude Code
Everything Claude Code 更像一套“把 Claude Code 用到极致”的配置样板。
它背后有一个传播度很高的故事:作者曾在 8 小时内用 Claude Code 完成一个产品,并获得 Anthropic 黑客松冠军,之后他把相关配置整理成开源仓库,现在 GitHub 上已接近 4 万 Star。
这个项目值得关注的地方远不止命令的多少。它把 Claude Code 的工作方式重新拆解,让 AI 写代码时有角色、有边界、有自动检查,避免在同一个聊天上下文里硬撑长任务。
| 组件类型 | 作用说明 |
|---|---|
| Agents | 将规划、架构、TDD、审查等任务交给不同子 Agent |
| Skills | 沉淀可复用的工作流,如测试优先、后端开发规范 |
| Hooks | 在关键节点自动跑检查,比如提交前扫描调试日志 |
| Rules | 放团队或个人的长期编码规则 |
| Commands | 通过 /tdd、/code-review 等命令快速触发固定流程 |
原仓库给出过一组实战数据:功能开发速度提升 65%,代码审查问题减少 75%,PR 平均问题数从 12 个降到 3 个。这些数字可以先当成作者自己的测试结果,不必直接等同于每个人的收益;但它至少说明一件事:Claude Code 的效果非常依赖周边流程。
我更在意的,是它对上下文腐化的处理。
Claude Code 在连续处理长任务时,前面讨论过的约束、临时决策、文件边界,很容易在后续对话中淡化。Everything Claude Code 的做法是把这些分别沉淀到 Agents、Skills、Rules、Hooks 里:该规划的去规划,该审查的去审查,该检查的交给 Hook,上下文压力自然变小,输出也更稳定。
但它不像 Superpowers 装完就只有一条主线,配置项会更多。刚上手时可以先抄它的目录结构和几个高频命令,不必一股脑全搬进项目。
项目地址:https://github.com/affaan-m/everything-claude-code
Doc Co-Authoring
前两个技能更偏代码执行,Doc Co-Authoring 则靠前一步,主要解决“还没到写代码那一步”的问题。
很多返工其实埋藏在需求刚出口的那几分钟。你给 AI 一句“做个退款功能”,它当然可以立刻开始写 Controller、Service、表结构和测试;但退款状态怎么流转、接口是否幂等、优惠券和库存如何回滚、失败后要不要人工补偿,这些没说清楚时,后面写得越快,改起来越痛。
Anthropic 官方 Skills 仓库里的 doc-coauthoring,特别适合放在编码之前使用。它关心的是 PRD、技术方案、决策文档、RFC 这类协作文档的质量,重点放在上下文、结构和读者理解上,文字润色反而排在后面。
它的流程大致分三段:
| 阶段 | 做什么 |
|---|---|
| Context Gathering | 先收齐背景、约束、历史讨论、架构依赖和相关方关注点 |
| Refinement & Structure | 按章节来回打磨,先提问和展开,再筛选内容,最后整理成段落 |
| Reader Testing | 换一个全新上下文的 Claude 来读文档,检查遗漏和误解 |
我比较推荐把它和开发类 Skill 串联使用:先用 doc-coauthoring 写一份短方案,把状态机、接口约束、异常分支和验收标准列清楚;然后再交给 Superpowers 这类工具拆任务、写测试、写实现。
这样做会慢一点,特别小需求会显得绕。但只要任务涉及多模块、多角色或多失败分支,先写好文档通常比后面补救更便宜。
安装 Anthropic 官方示例 Skills:
/plugin marketplace add anthropics/skills
/plugin install example-skills@anthropic-agent-skills
项目地址:https://github.com/anthropics/skills/tree/main/skills/doc-coauthoring
UI UX Pro Max
这是一款专为 AI 编程 Agent(Claude Code、Cursor、Windsurf 等)设计的专业 UI/UX 设计 Skill。
它的核心能力是一键生成完整的设计系统(Design System),根据产品类型和行业特性自动给出设计决策。
v2.0 新增的 Design System Generator,能根据你的产品类型、行业特征、目标用户,在几秒内自动输出一套完整的设计系统。
该技能内置的设计知识库:
| 资源类型 | 数量 | 说明 |
|---|---|---|
| UI 风格 | 67 种 | Glassmorphism、Neumorphism、Bento Grid、AI-Native UI 等 |
| 行业色板 | 161 个 | 每个行业都有专属配色方案,全部带色值说明 |
| 字体搭配 | 57 种 | 精选字体组合,附带 Google Fonts 链接 |
| 推理规则 | 161 条 | 行业特定的设计系统生成规则 |
| UX 准则 | 99 条 | 最佳实践、反模式与可访问性规则 |
| 支持技术栈 | 13 种 | React/Next.js + shadcn/ui、Vue/Nuxt、Tailwind、SwiftUI、Flutter、React Native 等 |
它是如何工作的?
当你输入“帮我做一个美容 SPA 的落地页”时,它不会随便扔一套紫色渐变,而是会推理:这是健康养生行业 → 推荐柔和的 Soft UI 风格 → 配色用淡粉 + 鼠尾草绿 + 金色点缀 → 字体选优雅的 Cormorant Garamond,同时还会列出该行业应该避免的反模式(比如不要使用 AI 感十足的紫粉渐变)。
安装非常简单:
Claude Code(推荐):
/plugin marketplace add nextlevelbuilder/ui-ux-pro-max-skill
/plugin install ui-ux-pro-max@ui-ux-pro-max-skill
Cursor / Windsurf / Continue 等:使用官方 CLI
npm install -g uipro-cli
uipro init --ai claude # 或 cursor、windsurf 等
安装后,只需用自然语言描述 UI 需求,技能会自动激活:
帮我做一个 SaaS 产品的落地页
设计一个医疗分析仪表盘
做一个深色主题的金融 App
它还会自动生成 Pre-delivery Checklist,确保没有 emoji 当图标、hover 状态完整、reduced-motion 被尊重等专业细节。
项目地址:https://github.com/nextlevelbuilder/ui-ux-pro-max-skill
如果你觉得 UI UX Pro Max 偏重,只需要一个轻量的前端设计指导,可以试试 Anthropic 官方的 frontend-design Skill。它专注避免 AI 生成的“千篇一律”美学——拒绝 Inter/Roboto 等泛滥字体,拒绝紫白渐变这类套路配色,鼓励大胆的排版和非常规布局。虽然没有 UI UX Pro Max 那么完整的设计知识库,但胜在轻量,适合设计要求不那么复杂的小场景。
sanyuan-skills
这是一个面向生产环境的 Claude Code 技能集合,把资深工程师的审查经验封装成 Skill,让 AI 从多个专业维度审查代码。
目前包含三个核心技能:
| 技能名称 | 核心功能 | 适用场景 |
|---|---|---|
| Code Review Expert | 资深工程师级别的代码审查,覆盖 SOLID 原则、安全性、性能、错误处理、边界条件等 | 代码提交前的质量把关 |
| Sigma | 基于 Bloom’s 2-Sigma 掌握学习理论的 1 对 1 AI 导师,采用苏格拉底式提问 | 学习新技术、深入理解某个概念 |
| Skill Forge | 元技能,用于创建高质量 Skill,内置 12 种经过实战检验的技术 | 想自己开发 Skill 时的起点 |
Code Review Expert 的审查维度:
- SOLID 原则:单一职责、开闭原则、里氏替换等
- 安全性:SQL 注入、XSS、敏感信息泄露等
- 性能:算法复杂度、内存泄漏、不必要的循环等
- 错误处理:异常捕获、边界条件、空值处理等
- 代码质量:命名规范、注释、可读性等
安装命令:
# 审查专家
npx skills add sanyuan0704/sanyuan-skills --path skills/code-review-expert
# Sigma 导师
npx skills add sanyuan0704/sanyuan-skills --path skills/sigma
# Skill Forge
npx skills add sanyuan0704/sanyuan-skills --path skills/skill-forge
安装后在 Claude Code 中直接调用:
/code-review-expert # 审查当前 git 变更
/sigma <主题> # 启动学习辅导,例如 /sigma React Hooks
/skill-forge # 创建新技能
项目地址:https://github.com/sanyuan0704/sanyuan-skills
Web Access
Claude Code 自带 WebSearch 和 WebFetch,但缺少编排策略与浏览器自动化能力。这个 Skill 补上了这一块——让 Claude Code 能自主浏览网页、操作动态页面,并跨会话积累站点经验。
| 能力 | 说明 |
|---|---|
| 自动工具选择 | 根据场景自动选择 WebSearch / WebFetch / curl / Jina / CDP,可自由组合 |
| CDP 浏览器操作 | 直连日常使用的 Chrome,自然携带登录态;支持动态页面、交互操作、视频帧捕获 |
| 并行分治 | 派发子 Agent 并行处理多个目标,共享一个 Proxy,Tab 级隔离 |
| 站点经验积累 | 按域名存储操作经验(URL 规律、平台特征、已知坑点),跨会话复用 |
| 媒体提取 | 直接从 DOM 提取图片/视频 URL,或截取任意时间点的视频帧并分析 |
v2.4.1 将脚本从 bash 迁移到 Node.js,支持 Windows / Linux / macOS,还新增了 DOM 边界穿透能力,能处理 Shadow DOM、iframe 等选择器无法到达的元素。
安装方式:
git clone https://github.com/eze-is/web-access ~/.claude/skills/web-access
前提条件:Node.js 22+,Chrome 需开启远程调试(在 chrome://inspect/#remote-debugging 中勾选"Allow remote debugging for this browser instance")。
安装后可以直接用自然语言驱动:
搜索一下 xxx 的最新进展
帮我去小红书搜一下 xxx 的账号
同时调研这 5 个产品网站,给我一个对比总结
项目地址:https://github.com/eze-is/web-access
Webapp Testing
Web Access 更偏向“上网和操作现有网站”,而 webapp-testing 更适合程序员的本地开发场景:启动本地服务,打开页面,跑 Playwright 脚本,检查交互、控制台日志和截图。
它解决了一个很具体的问题:AI 写完前端后,通常只跑 npm run build,却没有真正点页面。构建通过不代表按钮可点、弹窗正常、表单校验生效,也不代表移动端没有遮挡。
webapp-testing 内置了一套 Playwright 测试流程:
| 能力 | 说明 |
|---|---|
| 服务生命周期管理 | 通过 scripts/with_server.py 启动一个或多个本地服务,测试结束后自动处理退出 |
| 动态页面检查 | 等待 networkidle 后再检查 DOM,避免页面未渲染完就开始断言 |
| 截图与日志捕获 | 保存页面截图,读取控制台日志,适合排查前端样式和运行时错误 |
| 元素发现 | 先侦察页面上的按钮、链接、输入框,再生成更可靠的选择器 |
常见用法:AI 写完一个管理后台页面后,让它用 webapp-testing 打开 http://localhost:5173,检查新增按钮、表单提交、错误提示、弹窗关闭、暗色模式和移动端宽度下的布局。这个环节不一定替代正式 E2E 测试,但能抓住很多“代码看起来没问题、页面一用就露馅”的问题。
如果前面已安装 Anthropic 的 example-skills,通常不用重复安装,直接在对话中提及“use webapp-testing”即可触发。
项目地址:https://github.com/anthropics/skills/tree/main/skills/webapp-testing
MCP Builder
MCP 已成为 AI 编程工具中绕不开的一层:数据库、内部平台、工单系统、知识库、部署平台,都可以通过 MCP 暴露给 Agent。
但 MCP Server 并不是把 API 简单包一层就完事。更容易踩坑的地方在于工具边界、参数收敛、错误返回、鉴权、分页,以及如何让 Agent 调用后拿到足够稳定的结果。
mcp-builder 是 Anthropic 官方提供的 MCP Server 开发 Skill,用来指导构建高质量 MCP 服务。它覆盖 Python 的 FastMCP,也覆盖 Node/TypeScript 方向的 MCP SDK。
我把它放在“程序员必备”里,原因很简单:当你开始频繁让 AI 读项目、查内部文档、跑部署、查监控时,单靠复制粘贴上下文很快就会遇到瓶颈。MCP 的作用就是把这些重复动作变成可调用的工具。
适合处理的场景:
- 把公司内部 OpenAPI 封装成 MCP 工具,让 Agent 能查订单、查用户、查配置
- 给数据库查询加一层受控工具,限制只读、限制表范围、统一脱敏
- 把部署、日志、告警平台的常用动作封装成标准工具
- 为团队沉淀一套可复用的 Agent 工具层,而不是每个人都去写一遍脚本
需要诚实说明:MCP Builder 更适合已经准备好做工具集成的同学。刚接触 AI 编程时,可以先用 Superpowers、sanyuan-skills 等开箱即用的 Skill;等你发现 Agent 总在重复查同一批系统,再来考虑写 MCP Server。
项目地址:https://github.com/anthropics/skills/tree/main/skills/mcp-builder
Claude API
如果你的工作只是在 IDE 里用 AI 写代码,Claude API 这个 Skill 不一定每天用到。
但当你开始开发 AI 应用——智能客服、代码生成平台、文档分析工具、内部 Agent 平台——它就变得很有价值,因为 API 细节变化快,靠记忆写 SDK 调用很容易写出过期代码。
Anthropic 官方的 claude-api Skill 覆盖了模型选择、价格、参数、流式输出、工具调用、MCP、Agent、缓存、Token 计算和模型迁移等内容,还按语言拆分了文档目录:
| 语言 / 接入方式 | 说明 |
|---|---|
| Python | 使用官方 Python SDK |
| TypeScript | 使用官方 TypeScript SDK 和 Zod |
| Java | Java / Kotlin / Scala 项目可参考 |
| Go | Go 服务端应用可参考 |
| Ruby / PHP | 适合对应语言栈项目 |
| C# | .NET 项目可参考 |
| cURL | 原始 HTTP、Shell 脚本或调试用 |
这个 Skill 最值得借鉴的一点是它的“先查文档再写代码”约束:遇到 SDK 方法名、参数、流式事件、工具调用结构时,不允许 AI 凭印象猜。对 API 集成来说,这比多写几行示例代码更重要。
项目地址:https://github.com/anthropics/skills/tree/main/skills/claude-api
skill-creator
这是 Anthropic 官方 Skills 仓库中的一个元技能,专门用于创建、修改和优化 Skill。
它提供了一套 Skill 开发工作流:
| 阶段 | 工作内容 |
|---|---|
| 意图捕获 | 理解你想让 Skill 做什么,明确边界和目标 |
| 起草 SKILL.md | 编写 Skill 的核心指令文件,包含 frontmatter 和指令内容 |
| 测试验证 | 创建测试用例,运行对比实验(有 Skill vs 无 Skill) |
| 迭代优化 | 根据测试反馈持续改进指令 |
| 描述优化 | 优化 Skill 的 description,提高触发准确性 |
它还内置了评估系统:生成可视化评测报告,对比“使用 Skill”与“不使用 Skill”的输出差异,支持多轮迭代优化。
适合想为团队制作专属 Skill 的开发者作为起点。
项目地址:https://github.com/anthropics/skills/tree/main/skills/skill-creator
总结
按场景整理一下,方便按需选择:
| 场景 | 推荐 Skill | 一句话说明 |
|---|---|---|
| 完整开发流程 | Superpowers | TDD + Code Review + 自动计划,装完直接用 |
| 多角色协作 | Everything Claude Code | 子 Agent 分工,解决上下文腐化 |
| 需求与技术文档 | Doc Co-Authoring | PRD、技术方案、决策文档的协作写作流程 |
| UI 设计 | UI UX Pro Max / frontend-design | 前者完整设计系统,后者轻量设计指导 |
| 代码审查 | sanyuan-skills | SOLID + 安全 + 性能多维度审查 |
| 网页浏览与操作 | Web Access | CDP 浏览器自动化 + 站点经验积累 |
| 本地 Web 验收 | Webapp Testing | Playwright 交互测试 + 截图和日志检查 |
| 工具接入 | MCP Builder | 开发 MCP Server,连接内部 API 和平台 |
| AI 应用开发 | Claude API | SDK、流式输出、工具调用、缓存和模型迁移 |
| 自制 Skill | skill-creator | Anthropic 官方的 Skill 开发工具 |
不必全部安装,根据日常场景挑几个即可。刚开始接触,建议从 Superpowers 和 sanyuan-skills 入手,先把开发流程和代码质量兜住;如果你经常做前端开发,再加一个 Webapp Testing;如果已经开始为团队构建内部 Agent,MCP Builder 和 skill-creator 会更有用。