Claude Code生态最强框架GSD万字深度实测：不写代码也能拿下35000颗星,到底烧Token还是真神器？

May 10, 2026

“I’m a solo developer. I don’t write code — Claude Code does.”
一个完全不会写代码的人，却做出了整个 Claude Code 社区争议最大的工程框架。

如果你在 Claude Code 的世界里待得足够久，一定听过 GSD（Get Shit Done）这个名字。

GitHub 上 35000+ Star，npm 周下载量过万，Reddit 和 Hacker News 上永远吵成一锅粥——有人用它从零搭出完整 SaaS 产品并成功上线，也有人痛骂烧了一周 API 额度只产出了 500 行代码。

今天这篇文章，我不想列功能清单。咱们坐下来好好聊聊：这个框架到底解决了什么痛点，为什么评价会这么撕裂，以及——它究竟适不适合你。

不会写代码的人，却造出了最强框架

GSD 的作者叫 Lex Christopherson，网名 TACHES，GitHub 上叫 glittercowboy。他的自我介绍特别有意思：“House music producer & AI guy”——一个做电子音乐的，硬是搞出了 Claude Code 社区最复杂的工程化框架。

他的起点很简单：他自己完全不写代码，一切开发都交给 Claude Code。但在重度使用过程中，他撞上了一个要命的问题——上下文腐败（Context Rot）。

什么是上下文腐败？

你跟着 Claude Code 密集聊了两个小时后，上下文窗口眼看就要被塞满。这时候你能明显感觉到，Claude 产出的代码质量在滑坡——开始敷衍、省略错误处理、跳过边界情况。不是模型突然变蠢了，而是它一次要记住的东西太多，注意力已经涣散了。

就像你让一个人同时牢记 50 件事，还要求他写出一篇好文章——根本不可能。

Lex 的应对方案暴力但极其有效：绝不让单个 Agent 扛下所有工作，每项子任务都给一个全新的 200K 上下文窗口。

主会话永远把上下文使用率控制在 30%-40% 之间，只要是重活、累活统统派给子 Agent 去干。子 Agent 干完就把结果写回文件系统，主会话只需要读一下摘要。

这就是 GSD 最核心的设计哲学。

六步工作流：不是玩具，是一条严肃的工程流水线

GSD 绝不是那种“一键搞定”的玩具，它的完整工作流极像一条工业化组装线。

第一步：`/gsd-new-project` — 项目初始化

一条命令下去，GSD 会同时拉起 4 个研究 Agent 并行开工：

一个深入研究技术栈
一个拆解功能特性
一个分析架构模式
一个摸排常见陷阱

四个 Agent 各自带着干净的上下文工作，结束时汇总成 REQUIREMENTS.md（需求文档）、ROADMAP.md（路线图）和 PROJECT.md（项目愿景）。

第二步：`/gsd-discuss-phase N` — 需求讨论

GSD 会像一位老练的产品经理那样跟你“聊需求”。它会主动识别你描述里的灰色地带——比如“做一个好看的落地页”，什么叫好看？要哪种风格？给谁看？

刚开始我特别不习惯这种追问，后来才明白——项目越复杂，这个环节就越值钱。跳过讨论直接开干，大概率得返工。

第三步：`/gsd-plan-phase N` — 制定计划

先派出研究 Agent 做技术调研，再由规划 Agent 制定 2-3 个原子化的执行计划。每个计划都是 XML 结构的任务清单，附依赖关系图。

更妙的是，GSD 内置了计划检查器——规划 Agent 出稿后，检查器 Agent 会进行全面审查，一旦发现漏洞就退回重写，最多迭代 3 轮。

第四步：`/gsd-execute-phase N` — 执行

这里是 GSD 最硬核的环节。执行并不按顺序推进，而是波次并行的：

第 1 波（并行）: 任务 A + 任务 B（无依赖）  
第 2 波（并行）: 任务 C（依赖A） + 任务 D（依赖B）  
第 3 波:        任务 E（依赖 C + D）

每个任务由独立的执行 Agent 完成，拥有干净的上下文窗口。每完成一个任务，自动创建一个 git commit——原子化提交，完整可追溯。

第五步：`/gsd-verify-work N` — 验证

做完不等于做好了。GSD 的验证 Agent 会提取可测试的交付物，逐条核对。一旦发现问题，自动生成修复计划。

第六步：`/gsd-complete-milestone` — 收尾

归档里程碑，打上 Release Tag，准备进入下一个迭代。

快捷命令 /gsd-next 可以自动检测你当前处于哪一步，然后直接执行下一步。

为什么有人爱它爱到不行，有人恨得牙痒？

这是我这篇文章最想展开的部分。同样一个工具，视角不同，结论可能完全相反。

热爱它的人怎么说

Hacker News 上有一位用户，用 GSD 从零搭出完整 SaaS 产品 whiteboar.it 并成功上线：

“GSD consistently gets me 95% of the way there on complex tasks. That’s amazing. The last 5% is mostly manual testing.”

另一位用户用 GSD + Codex 做了一个 macOS 原生应用，已经在考虑上架 App Store：

“I got sick of paying FreshBooks monthly for basic income/expense tracking. Used GSD to build a macOS Swift app. It’s working great.”

还有一个让我格外印象深刻的案例：一位零 App 开发经验的系统工程师，用 GSD 不到一个月产出了一个约 250K 行代码的 VPN 管理平台，包含 TypeScript 后端和 SwiftUI 的 iOS/macOS 客户端，支持多云部署。

LinkedIn 上还有人做了量化测试：原本需要 2-3 天的工作量，用 GSD 压缩到了 8 小时。

痛恨它的人怎么说

批评的声音同样毫不留情。

最常见的槽点：太烧 Token 了。

“I burned literally a week’s worth of the $20 worth of API credits on GSD. To get like 500 LOC.”

“Just tried GSD and Plan Mode on the same exact task. Plan Mode had a plan and then base implementation in twenty minutes. GSD ran for hours to achieve the same thing.”

也有人抱怨它过于沉重：

“It was incredibly verbose, generating an insane amount of files. I stopped using it because I was worried it would not be possible to rapidly, cheaply, and robustly update things.”

甚至有人直接调侃它的名字：

“Required far too much back and forth. Ate too many tokens. It should be called planning-shit instead.”

这些批评全部真实存在，绝不是黑子。我认真分析后觉得，根源在于 GSD 的架构设计——它用 4 个 Token 做协调，1 个 Token 写代码。对于简单任务，这个开销比确实太离谱；但对于复杂项目，这种开销恰恰就是质量的保障。

GSD vs Superpowers vs BMAD：三方横向对比

Claude Code 社区当下最火的三套工程化框架，我整理了一个简单对比：

维度	GSD	Superpowers	BMAD
核心思路	控制上下文环境	控制编码流程	控制开发仪式
哲学	每个任务干净上下文	强制 TDD 流水线	企业级故事点
适合谁	独立开发者、非程序员	有工程经验的开发者	团队协作
Token 开销	高（多 Agent 协调）	中等	高
上手难度	中等	低	高
灵活性	较低（瀑布式流程）	高	低
最佳场景	大型从零项目	增量开发	企业项目

Medium 上有一篇对比文章总结得非常到位：Superpowers 约束的是 AI“怎么写代码”，GSD 约束的是 AI“在什么条件下写代码”，gstack 约束的是 AI“以什么角色写代码”。

我个人的建议：如果你是独立开发者，准备做一个完整产品，请用 GSD。如果你是工程师想在日常开发中提效，请用 Superpowers。如果你是技术 Leader 要管团队，不妨看看 BMAD。

快速上手指南

讲了这么多理论，如果你决定给 GSD 一次机会，三步就能跑起来。

1. 安装

npx get-shit-done-cc@latest

安装器会询问你装在哪个运行时（Claude Code / Cursor / Windsurf / Codex 等），以及是全局安装还是仅当前项目。

如果要在 CI 环境非交互式安装，可以这样：

npx get-shit-done-cc --claude --global

2. 验证

/gsd-help

看到帮助信息就表示安装成功了。

3. 开始使用

# 新建项目  
/gsd-new-project  
  
# 接着一路下一步  
/gsd-next

几个实用命令

命令	作用
`/gsd-quick`	快速模式，绕过完整流水线处理小任务
`/gsd-progress`	查看当前项目进度
`/gsd-resume-work`	恢复上次中断的工作
`/gsd-health`	检查项目健康状态
`/gsd-debug "描述"`	用科学方法论进行调试
`/gsd-code-review N`	对第 N 阶段做代码审查

五条发自内心的建议

在 AI 编程工具里泡了这么久，我攒下了几条关于 GSD 的真实体会。

第一，别拿 GSD 去改 bug 或调样式。 它的设计初衷是管理复杂项目。你要是用它修个按钮颜色，就像开航母去钓鱼——不是钓不到，但油钱会心疼死你。

第二，千万不要跳过 discuss 阶段。 GSD 最常被吐槽的就是“聊太多”，但数据不会骗人：跳过讨论的项目，返工率是不跳过的 2-3 倍。那些批评 GSD 是在“planning-shit”的人，很多恰恰就是跳过了讨论之后得到了不理想的结果。

第三，提前备好 Token 预算。 GSD 的协调开销是实打实的。Pro 计划根本不够用，Max 计划（$100-200/月）才是起步价。如果你用的是按量计费的 API，更要做好心理准备。

第四，大项目上 GSD，小任务用 /gsd-quick。 框架自带的快速模式可以绕过完整流水线，特别适合几十分钟就能搞定的琐事。

第五，先拿一个小项目练手。 绝对不要一上来就拿 GSD 做你的核心业务。找个 side project 完整走一遍流程，感受一下节奏，再决定是否主力采用。

你到底适不适合用 GSD

你可能很适合，如果：

你是独立开发者，想从零搭建一个完整产品
你不太会写代码，但脑子里有个很棒的产品想法
你的项目超过 50 个文件，每次改代码都胆战心惊
你受够了 Claude Code 写到后半段代码质量断崖式下跌
你需要可追溯、原子化的 git 提交历史

你可能不适合，如果：

你只是偶尔让 AI 帮忙写几行小代码
你的项目很小，几页代码就完事
你预算吃紧，不想在 Token 上投入太多
你喜欢灵活机动的开发方式，受不了瀑布式的仪式感
你是资深工程师，直接用 Plan Mode 效率反而更高

写在最后

GSD 是一个态度极其鲜明的工具。它的作者 Lex 从一开始就没想过要做一个“万能框架”——他追求的，是一套能让完全不懂代码的人也能持续交付高质量软件的系统。

这个目标他做到了。代价是 Token 开销、是等待的时间、是流程中满满的仪式感。

有人说这些框架终究是过渡品，未来模型足够强大了就没人需要了。我部分同意。但在 2026 年的今天，如果你真的想在 Claude Code 上做严肃的项目开发，GSD 仍然是当下最成熟的选择之一。

不是因为它完美，恰恰是因为它解决了真实存在的问题。

项目地址： github.com/gsd-build/get-shit-done

安装命令： npx get-shit-done-cc@latest

Discord 社区： 项目 README 中可获取邀请链接

第一步：/gsd-new-project — 项目初始化

第二步：/gsd-discuss-phase N — 需求讨论

第三步：/gsd-plan-phase N — 制定计划

第四步：/gsd-execute-phase N — 执行

第五步：/gsd-verify-work N — 验证

第六步：/gsd-complete-milestone — 收尾