PilotDeck 开源本地 Agent OS 实测:一句话需求,AI 自动搭建一人公司智能体官网
我原本想自己做一个网站来服务 OPC,但页面到底要怎么设计呢?说实话我自己也没想好。如果我自己来 Vibe coding,不算难,但很碎。要确认信息架构,要确认页面,要做交互,要调响应式,要跑起来看效果,还要不断修小 bug。最烦的不是写代码,而是你得一直盯着它。
于是我把这个任务丢给了 PilotDeck,一个由面壁智能联合清华大学 THUNLP 实验室、OpenBMB 与 AI9stars 开源的 Agent OS。

它和其他的 Agent 不一样的点在于,PilotDeck 更像是给 Agent 准备的一间工作舱:一个项目一个 WorkSpace,里面有单独的文件、记忆、技能、任务进度,甚至还能看到成本记录。

更重要的是,它开源了。这意味着,Agent OS 不再只是大公司的某个产品形态。每个人都可以把它部署到本地,让自己的电脑拥有一个真正能装项目、跑任务、沉淀记忆的 Agent 工作舱。

逐步实测:从一句话到一个完整官网的自动化之旅
我想做一个能真正跑起来的 WOYIN 官网,我原本只给了一句话:
帮我做一个 AI 一人公司智能体军团的平台网站,根据 OPC 不同的业务场景来划分类别。
PilotDeck 识别到了我的需求,然后委托了一个子智能体来构建这个网站。

让我感到惊喜的是,这次不仅仅是一个静态展示页,而是一个完整的带交互和动态效果的官网。它甚至帮我写了 Canvas 粒子星空背景、CountUp 数字增长动画、8 个业务场景 Tab 的无刷新切换,还写了卡片 hover 发光、滚动入场动画和移动端汉堡菜单。这类细节放在普通需求里,往往要来回追问很多轮:“能不能再加一点动态效果?”“移动端能不能帮我适配一下?”但 PilotDeck 在这个 WorkSpace 里,是按“一个高质量官网”的标准往前推,而不是只把 HTML 写出来交差。
原本我以为到这里就结束了,然而 PilotDeck 继续做了这几件事。
它运行网站,打开浏览器预览,自己开始截图看效果。第一次看页面时,它发现导航区域和 Hero 区域有文字重叠。

PilotDeck 定位到问题,开始调整。然后重新加载页面,再继续看下一屏,继续检查页面上的其他功能,并且挨个修复。

这一段体验,真的已经非常接近一个小型前端同事在干活了:先实现、再跑起来、再看页面、再修问题、再继续验证。它不是只生成代码,而是在推进一个任务的闭环。

最后它给出的验证结果也很完整:导航栏、Hero 首屏、统计数字、价值主张、智能体军团、Tab 交互、成功案例、定价方案、Footer,都逐项确认。来看看第一版的成品:
首屏有品牌、有 slogan、有 CTA 按钮,还有粒子星空背景。更关键的是,它不是只做了一个好看的壳,而是把整个页面拆成了 6 个模块:Hero 首屏、价值主张、智能体军团目录、成功案例、定价方案、Footer。
智能体军团目录里,它按 OPC 的真实业务链路,分了 8 个场景:营销增长、销售转化、产品研发、财务管理、运营效率、品牌设计、法务合规、全球扩展。每个场景下面放 4 个智能体,一共 32 张卡片。比如营销增长里有内容创作、SEO 优化、广告投放、社媒运营;产品研发里有需求分析、代码助手、测试、文档生成;全球扩展里有翻译本地化、跨境电商、时区协作、海外客服。

第一版网站快速跑通之后,我还想把之前自己做过的一些项目,也同步到这里来方便快捷查询使用。于是,我继续追加了需求:
帮我继续完善官网的功能,把我的 GitHub 上面的几个开源项目都集成到这个网站来,地址是 https://github.com/woyin2024
PilotDeck 开始收集项目信息,新增“开源生态”区块,再更新导航和 Footer,最后继续生成项目详情页。最后给了我一个公网访问地址。

它甚至帮我把每一个项目,都做了清晰的介绍,包括源码地址、使用场景、安装指南等等。尽管我只给了他一个我的 GitHub 主页地址而已。这样的 AI 员工谁不爱呢?
不止是完成任务:PilotDeck 的三大独特能力
除了完整的建站体验,PilotDeck 还有几个值得单独说明的亮点。
- Always-on 常驻:按项目自动值守
PilotDeck 的 Always-on 与众不同的地方在于,它可以围绕项目自动管理常驻任务,不需要用户主动触发模型就会自动执行,并且能够主动发现问题、推进工作。

这种模式更像是“能自己守着项目现场的执行者”,而不需要你定时去点一下按钮。
- 智能路由:省钱这件事,它是认真的
我用其他 Agent 跑任务,月底账单经常比预期多。毕竟一个 Coding 项目里,并不是每一步都需要顶级模型:需求拆解、架构判断、错误定位需要强模型;整理文件、改字段、补样式、跑重复检查,更便宜的模型或子 Agent 就足够了。PilotDeck 的智能路由会自动判断任务难度,复杂任务给强模型,简单任务动态降级,成本按任务追踪。如果是社媒场景开启智能路由,大概可以节省约 70% 成本;复杂任务测试里,也有用约 1/6 成本达到超过 Claude Sonnet 4.6 单 Agent 效果的结果。

我觉得这里最重要的不是“便宜”两个字,而是 Agent 一旦进入长期项目,就必须从“炫技”变成“算账”。一人公司也好,独立开发者也好,我们不是缺一个会烧钱的 AI,我们缺的是一个知道什么时候该用好钢、什么时候该省 token 的项目搭子。
- 白盒记忆:终于可以“揪出是哪里错了”
之前用 AI 最崩溃的事情,就是它的记忆是个黑盒——你知道它错了,但找不到错在哪,更不知道怎么改。PilotDeck 的记忆是白盒的。你可以随时打开记忆文件,看看它“记住”了什么。如果发现记错了,还可以直接改掉,下次它就按新的来。这才是真正的“越用越听话”。

它的记忆围绕项目持续沉淀:比如我要做的是 AI 一人公司平台官网,它就会记住我的限制条件、当前阶段、项目规范等等。长期项目最怕的不是 AI 偶尔犯错,最怕的是它把错误沉淀成记忆,然后越跑越歪。白盒记忆,就是给长期协作留一条刹车线。

总结:从灵感迈向执行,一个人也可以调度一支智能体小队
PilotDeck 的背后是清华 THUNLP、面壁智能、OpenBMB 与 AI9stars 的联合研发。面壁智能这条技术线,过去在 MiniCPM、Agent 和端侧模型上一直很硬。这次把 PilotDeck 开源出来,本质上也是把他们对 Agent 生产力的一套理解摊到了台面上。

做完这个网站,我最大的感受是:Agent 真正缺的,不是再多一层话术,而是一个能持续干活的项目现场。
以前我们说一人公司,多少带点悲壮。一个人写产品,一个人做内容,一个人改页面,一个人发售后,一个人看数据。听起来很自由,做起来很容易变成“一个人开八个工位”。但 PilotDeck 让我感觉,它更像是:一个人提出目标,一个工作舱承载上下文,一组 Agent 分头推进,一套记忆持续沉淀。人只做方向判断和关键取舍,AI 做拆解、执行、验证和复盘。
它没有把 AI 包装成万能员工,而是在给普通人搭一个小型操作系统,让你能调度一支小队。尤其对独立开发者、内容创作者、OPC 创业者来说,这件事很重要。因为我们缺的往往不是灵感,而是把灵感一路推到文件、页面、测试、部署、复盘里的执行链路。而 PilotDeck 可以在你的机器上管理项目、读取文件、沉淀记忆、调用技能、持续推进任务。从此,你不再只是打开一个网页问 AI 问题,而是在给自己的电脑装上了一间智能体办公室。
开源地址:https://github.com/OpenBMB/PilotDeck
官方网站:https://pilotdeck.openbmb.cn


