PilotDeck 开源本地 Agent OS 实测：一句话需求，AI 自动搭建一人公司智能体官网

June 13, 2026

我原本想自己做一个网站来服务 OPC，但页面到底要怎么设计呢？说实话我自己也没想好。如果我自己来 Vibe coding，不算难，但很碎。要确认信息架构，要确认页面，要做交互，要调响应式，要跑起来看效果，还要不断修小 bug。最烦的不是写代码，而是你得一直盯着它。

于是我把这个任务丢给了 PilotDeck，一个由面壁智能联合清华大学 THUNLP 实验室、OpenBMB 与 AI9stars 开源的 Agent OS。

它和其他的 Agent 不一样的点在于，PilotDeck 更像是给 Agent 准备的一间工作舱：一个项目一个 WorkSpace，里面有单独的文件、记忆、技能、任务进度，甚至还能看到成本记录。

更重要的是，它开源了。这意味着，Agent OS 不再只是大公司的某个产品形态。每个人都可以把它部署到本地，让自己的电脑拥有一个真正能装项目、跑任务、沉淀记忆的 Agent 工作舱。

逐步实测：从一句话到一个完整官网的自动化之旅

我想做一个能真正跑起来的 WOYIN 官网，我原本只给了一句话：

帮我做一个 AI 一人公司智能体军团的平台网站，根据 OPC 不同的业务场景来划分类别。

PilotDeck 识别到了我的需求，然后委托了一个子智能体来构建这个网站。

让我感到惊喜的是，这次不仅仅是一个静态展示页，而是一个完整的带交互和动态效果的官网。它甚至帮我写了 Canvas 粒子星空背景、CountUp 数字增长动画、8 个业务场景 Tab 的无刷新切换，还写了卡片 hover 发光、滚动入场动画和移动端汉堡菜单。这类细节放在普通需求里，往往要来回追问很多轮：“能不能再加一点动态效果？”“移动端能不能帮我适配一下？”但 PilotDeck 在这个 WorkSpace 里，是按“一个高质量官网”的标准往前推，而不是只把 HTML 写出来交差。

原本我以为到这里就结束了，然而 PilotDeck 继续做了这几件事。

视频截图
点击观看视频演示

它运行网站，打开浏览器预览，自己开始截图看效果。第一次看页面时，它发现导航区域和 Hero 区域有文字重叠。

PilotDeck 定位到问题，开始调整。然后重新加载页面，再继续看下一屏，继续检查页面上的其他功能，并且挨个修复。

这一段体验，真的已经非常接近一个小型前端同事在干活了：先实现、再跑起来、再看页面、再修问题、再继续验证。它不是只生成代码，而是在推进一个任务的闭环。

最后它给出的验证结果也很完整：导航栏、Hero 首屏、统计数字、价值主张、智能体军团、Tab 交互、成功案例、定价方案、Footer，都逐项确认。来看看第一版的成品：

视频截图
点击观看第一版演示

首屏有品牌、有 slogan、有 CTA 按钮，还有粒子星空背景。更关键的是，它不是只做了一个好看的壳，而是把整个页面拆成了 6 个模块：Hero 首屏、价值主张、智能体军团目录、成功案例、定价方案、Footer。

智能体军团目录里，它按 OPC 的真实业务链路，分了 8 个场景：营销增长、销售转化、产品研发、财务管理、运营效率、品牌设计、法务合规、全球扩展。每个场景下面放 4 个智能体，一共 32 张卡片。比如营销增长里有内容创作、SEO 优化、广告投放、社媒运营；产品研发里有需求分析、代码助手、测试、文档生成；全球扩展里有翻译本地化、跨境电商、时区协作、海外客服。

第一版网站快速跑通之后，我还想把之前自己做过的一些项目，也同步到这里来方便快捷查询使用。于是，我继续追加了需求：

帮我继续完善官网的功能，把我的 GitHub 上面的几个开源项目都集成到这个网站来，地址是 https://github.com/woyin2024

PilotDeck 开始收集项目信息，新增“开源生态”区块，再更新导航和 Footer，最后继续生成项目详情页。最后给了我一个公网访问地址。

它甚至帮我把每一个项目，都做了清晰的介绍，包括源码地址、使用场景、安装指南等等。尽管我只给了他一个我的 GitHub 主页地址而已。这样的 AI 员工谁不爱呢？

视频截图
点击观看完整效果演示

不止是完成任务：PilotDeck 的三大独特能力

除了完整的建站体验，PilotDeck 还有几个值得单独说明的亮点。

Always-on 常驻：按项目自动值守
PilotDeck 的 Always-on 与众不同的地方在于，它可以围绕项目自动管理常驻任务，不需要用户主动触发模型就会自动执行，并且能够主动发现问题、推进工作。

这种模式更像是“能自己守着项目现场的执行者”，而不需要你定时去点一下按钮。

智能路由：省钱这件事，它是认真的
我用其他 Agent 跑任务，月底账单经常比预期多。毕竟一个 Coding 项目里，并不是每一步都需要顶级模型：需求拆解、架构判断、错误定位需要强模型；整理文件、改字段、补样式、跑重复检查，更便宜的模型或子 Agent 就足够了。PilotDeck 的智能路由会自动判断任务难度，复杂任务给强模型，简单任务动态降级，成本按任务追踪。如果是社媒场景开启智能路由，大概可以节省约 70% 成本；复杂任务测试里，也有用约 1/6 成本达到超过 Claude Sonnet 4.6 单 Agent 效果的结果。

我觉得这里最重要的不是“便宜”两个字，而是 Agent 一旦进入长期项目，就必须从“炫技”变成“算账”。一人公司也好，独立开发者也好，我们不是缺一个会烧钱的 AI，我们缺的是一个知道什么时候该用好钢、什么时候该省 token 的项目搭子。

白盒记忆：终于可以“揪出是哪里错了”
之前用 AI 最崩溃的事情，就是它的记忆是个黑盒——你知道它错了，但找不到错在哪，更不知道怎么改。PilotDeck 的记忆是白盒的。你可以随时打开记忆文件，看看它“记住”了什么。如果发现记错了，还可以直接改掉，下次它就按新的来。这才是真正的“越用越听话”。

它的记忆围绕项目持续沉淀：比如我要做的是 AI 一人公司平台官网，它就会记住我的限制条件、当前阶段、项目规范等等。长期项目最怕的不是 AI 偶尔犯错，最怕的是它把错误沉淀成记忆，然后越跑越歪。白盒记忆，就是给长期协作留一条刹车线。

总结：从灵感迈向执行，一个人也可以调度一支智能体小队

PilotDeck 的背后是清华 THUNLP、面壁智能、OpenBMB 与 AI9stars 的联合研发。面壁智能这条技术线，过去在 MiniCPM、Agent 和端侧模型上一直很硬。这次把 PilotDeck 开源出来，本质上也是把他们对 Agent 生产力的一套理解摊到了台面上。

做完这个网站，我最大的感受是：Agent 真正缺的，不是再多一层话术，而是一个能持续干活的项目现场。

以前我们说一人公司，多少带点悲壮。一个人写产品，一个人做内容，一个人改页面，一个人发售后，一个人看数据。听起来很自由，做起来很容易变成“一个人开八个工位”。但 PilotDeck 让我感觉，它更像是：一个人提出目标，一个工作舱承载上下文，一组 Agent 分头推进，一套记忆持续沉淀。人只做方向判断和关键取舍，AI 做拆解、执行、验证和复盘。

它没有把 AI 包装成万能员工，而是在给普通人搭一个小型操作系统，让你能调度一支小队。尤其对独立开发者、内容创作者、OPC 创业者来说，这件事很重要。因为我们缺的往往不是灵感，而是把灵感一路推到文件、页面、测试、部署、复盘里的执行链路。而 PilotDeck 可以在你的机器上管理项目、读取文件、沉淀记忆、调用技能、持续推进任务。从此，你不再只是打开一个网页问 AI 问题，而是在给自己的电脑装上了一间智能体办公室。

开源地址：https://github.com/OpenBMB/PilotDeck
官方网站：https://pilotdeck.openbmb.cn