Hermes Agent 自动化深度实践:10招让你每周省下15小时

数据显示,90%的用户仅停留在启动层进行即时问答,而Hermes Agent真正的价值在于支持全天候后台值守(24/7)和自动化调度,每周能为你节约超过15小时。
- 你的Hermes用法可能只触及表层
很多人对Hermes的使用仅仅停留在“打开对话窗口—输入问题—等待回复—关闭会话”这四个步骤。这样一来,只有模型被直接调用,而那些不太显眼却极具价值的特性——Cron调度、Webhook触发、并行子代理、后台持久会话、状态看板以及技能脚本——全被晾在一旁。真正的分水岭不在于提示词的好坏,而在于运行架构的差异。常见问题包括频繁手动检查导致的人力消耗、信息延迟以及上下文的碎片化。破解之道是充分利用Hermes内置的调度、事件触发、任务隔离和持久化机制,将“人工踩油门”的模式转变为系统自动值守。
- 用 /goal 指令取代孤立提问,驱动自主任务执行
普通提示往往只求一次答案,而 /goal 命令则为任务划定完整边界,推动代理自驱动地完成目标。该命令包含四要素:结果、来源、约束和可交付物。在“结果”中要说清任务完成的标准,防止目标漂移;“来源”应指定工具、文件路径、目录或URL,切勿依赖代理记忆;“约束”可以限定文件格式、调用次数、风格规则或成本上限;“可交付物”则定义最终产出,比如文件名、JSON schema 或提交位置。如果你还不懂如何设计目标结构,可以先让Hermes向你提三个问题,再依据回答生成最强版的 /goal。
- 把重复工作自动化:利用时间触发器实现定时任务
Cron 是 Hermes 在后台释放效率的引擎,用以取代人工定时轮询。你无需记忆繁琐的 crontab 表达式,直接用日常语言描述周期即可。典型场景包括每日早晨汇总简报、每小时检查 GitHub 通知、每周归档线上会议纪要;这些任务全不用点“开始”。要让 Cron 真正见效,需注意两点:任务本身应短小且可中断,输出必须指向固定落点,例如发送到 Telegram、写入文件或推入特定看板列。避免将 Cron 任务设计成巨无霸,否则失败一次就需要从头重跑整个批次。
- 借助 Webhook 将外部事件转化为内部执行流程
Cron 依赖时间推进,而 Webhook 靠事件驱动。无论是 Notion 卡片、GitHub PR、表单提交还是第三方告警,只要它们能在状态变更时发出 HTTP 请求,Hermes 网关就能接收并立即启动 /goal。这特别适合“一旦发生就必须处理”的动作,如产品缺陷自动收集上下文、新 PR 执行检查清单、客户工单自动生成摘要。一个有效的工作模式是:事件触发后,Hermes 先根据卡片或工单的元数据提炼要点,经过格式校验后发送结果。其实质是将人工的“看到再处理”变成系统化的“到达即分流”。
- 用多话题与隔离空间化解并行任务冲突
在同一个会话中塞入过多任务,首当其冲的代价是上下文冲突。Hermes 支持多种隔离手段:Telegram 不同话题、指定目录作为工作区、多组配置文件以及看板列结构。每一条隔离通道都将“外来上下文”拒之门外,防止任务之间相互污染变量、路径或模板。如果你常常并行处理内容策划、代码审查和竞品跟踪,至少应分出两条职责链;每条链内部可再细化,但绝不可共用同一上下文。越早隔离,后续重排、监控与复盘的成本就越低。
- 利用看板将任务推向可追踪状态流
Hermes 内部的每项任务均可映射至看板,经历“待处理”、“进行中”直至“关闭”的状态流转。这样你便无需靠记忆追踪任务状态,也不必翻找聊天记录,只用一个固定视图便能掌握全局。看板尤其适用于多用户协作或自身拥有多个代理实例的场景。它还能帮你揪出两类隐疾:卡了太久的僵尸任务,以及看似未被阻塞却停滞不前的任务。前者需要重新指派,后者则要明确写入预期。
- 启用 Dashboard 与统一设置入口,削减频繁切换的摩擦
Hermes 自带的 Dashboard 能够在一个页面内呈现配置文件、定时任务、技能与看板状态;统一设置入口则通过 OAuth 授权同时接通模型、工具网关与聊天连接。这些集成会省去逐项核查配置的繁琐,也让你在出现故障时能迅速定位是权限、模型还是网关的问题。别小看初期的摩擦:多花十分钟对齐 Dashboard 与 Provider,此后每一次新任务都能避免一个易漏的检查点。
- 用并行子代理分担多源头信息收集
让一个主代理同时啃下多份数据集,结果多半是注意力稀释和上下文负载飙升。此时最佳方案是采用“调度器加工人”架构:将主代理拆分为多条子代理,各自在隔离上下文中搜索、汇总、生成摘要,最后将精简结果回传主线程。常见的例子是:一条子代理抓取社交媒体热度,一条分析历史表现,一条追踪竞品动态,主代理再将三份摘要合成为一份建议。将这种结构固化为模板技能,远比每次重新搭建来得快。
- 把流程固化为可执行 Skills,一次编写到处复用
Skills 是存放在 ~/.hermes/skills/ 下的可执行 SOP。定义好触发词、核心规则与步骤后,只要有同类请求,代理便自动加载执行,你无需每次都重复切分数据、检验格式、写入文件等相同操作。Skills 的好处在于可复现、可审查、可升级。如果团队共享同一个“内容发布 Skill”,风格与质量管控就能一次维护、全员受益。验证闸门、保护区与版本迭代正是 Skills 长期可用的关键。
Hermes+飞书CLI:打造X平台内容自动运营飞轮,AI工作流实战指南
今天参加了飞书举办的线上AI Builder分享会,收获颇丰。最近我一直在探索如何用Hermes与飞书CLI搭建一套专属于X平台的内容运营系统。简而言之,就是让智能助手帮我完成选题挖掘、账号分析、爆款内容整理、改写建议生成,并自动将结果同步到飞书多维表格中。我只需要专注于三件事:审核、调整、发布。跑通这套流程后,我才真正体会到飞书CLI的强悍之处——它能让普通人毫不费力地把AI助手接入自己的日常工作流。
我的飞书CLI实践:三步搭建内容运营流程
目前我将主要精力放在X平台的内容运营上,想看看自己能用多长时间把它做起来。得益于Grok与Hermes的打通,现在通过Agent直接在X上搜索帖子、分析账号、梳理互动策略,都变得非常顺手。
我的常规操作流程只有三步:
- 先用Grok在X平台检索爆款内容和高价值账号。
- 再用Hermes对这些内容进行深度分析。
- 最后通过飞书CLI,将有价值的数据写入飞书多维表格。
这样一套下来,选题方向、目标账号、爆款样本、改写思路、最佳发布时间……这些关键信息全部都能沉淀在表格里。所有内容都有记录,所有判断都有依据,所有复盘都有抓手。

这才是飞书文档真正适合作为内容中台发挥作用的地方。

Agent操控飞书文档:复盘自动化与画板可视化
更令人惊喜的是,飞书CLI现在可以让Agent以极顺畅的方式读写飞书文档和多维表格。例如,我可以直接让Hermes分析某个X账号近期的表现,并把结果自动回写到飞书文档里,甚至直接生成一份完整的复盘报告。

我只需要给出一个指令,后面的结构框架、内容总结、数据表格、行动建议,它都可以自动整理出来。这一点实在太实用了。很多时候,我们并不是真的缺数据,而是缺一个能持续复盘的习惯。现在Agent自动把数据拉回来,再生成一份结构化报告,复盘这件事立刻变得轻松了许多。
这次飞书CLI还有一个我特别喜欢的功能——画板。利用画板,Agent可以直接在文档中插入可视化图示,把原本密密麻麻的文字流程瞬间变成清晰的结构图。比如,将整个内容飞轮的运转逻辑用画板呈现出来,就直观多了。

还有内容整改建议,用画板分类展示后,执行起来也更条理分明。

如果只是一堆文字,理解起来难免会绕来绕去,但换成画板之后,整个执行链路一下就通了。画板的核心价值,就是把复杂的流程变成一张任何人一眼就能看懂的图。
Claude Code集成飞书:远程操控AI编程的新姿势
分享会中还有一个让我非常兴奋的项目——张咋啦老师开源了一个能把Claude Code接入飞书的方案。对我而言,日常使用最多的两类AI工具就是Hermes和Claude Code/Codex。Hermes本身自带APP接入渠道,我早已通过飞书机器人进行各种操作,但对于Claude Code,之前仍然得老老实实坐在电脑前才能使用。没想到这次竟然有了意外收获,找到了可以在任何地方指挥Claude Code写代码的方法。

安装过程极其简单,只需一条命令,再绑定一个飞书机器人即可:
npm i -g lark-channel-bridge
安装完成后,执行以下命令启动,会弹出二维码,扫码后根据指引完成配置:
lark-channel-bridge start

然后就可以愉快地通过飞书和Claude Code对话了。

这种躺在床上随手指挥CC干活的感觉,终于我也体验到了。
结语:AI工作流的关键在于稳定承接
过去我们使用Agent,很多时候像是在体验一个新玩具:它会写东西、会查资料、会跑任务,看起来很酷炫。但真正要把它落到日常工作中,还差一个稳定、可靠的承接系统。飞书CLI补上的,恰好就是这一环。
- IM负责接收和分发任务。
- 云文档负责沉淀内容资产。
- 多维表格负责结构化数据管理。
- 画板负责流程可视化。
- Agent负责具体执行与持续优化。
这套组合拳下来,任何一个普通人都可以慢慢搭建起属于自己的AI工作中台。所以我越来越清晰地感受到,接下来真正有价值的能力,不是你会不会用某个AI工具,而是你能不能把它无缝嵌入到自己的工作流里,让它每天稳定地帮你干活。AI的真正终点,从来不是陪你聊两句;真正厉害的AI,是能一步步把你的生活和工作串联起来,稳稳地向前推进。
Horizon开源AI热点抓取工具爆火:4000+ Star,自动生成中英双语日报
每天早上打开 Hacker News,没刷几页就感到倦怠。Reddit 里关注的 subreddit 堆了几十条未读,Telegram 频道的消息更是直奔 99+。信息源不断膨胀,可真正值得细看的内容却越来越难寻。
Horizon就是来解决这个难题的。它是一款用 Python 构建的开源工具,能够从多个信息源自动采集新闻,完成去重、AI 打分与过滤,最终产出结构清晰的中英双语日报。

简单讲:你只需要关注结果,中间的苦活累活都由它包揽。
数据透视:热度惊人
这个项目目前在 GitHub 上已揽获超过 4000 Star、500 多条 Fork。主编程语言为 Python,采用 MIT 开源协议。

覆盖哪些信息源
Horizon 当前支持 7 类信息源,基本包揽了技术人员每日必刷的渠道:

看得出,从技术社区到社交平台再到金融资讯,技术人员“日常必逛”的阵地几乎一网打尽。而且每个信源的抓取范围与评论条数都可以单独设定。
AI 智能评分:从筛选到精华
这正是 Horizon 与普通 RSS 阅读器的本质区别。
采集回来的内容不会一股脑儿全抛给你。Horizon 会依靠你指定的 AI 模型给每条内容打出 0–10 的分数,然后仅保留超过阈值的条目(默认 7.0)。拿到 9 分以上的内容会自动归入“Today’s Highlights”重点板块。

评分不止看标题热度。AI 会综合判断:这是否属于重大突破?有没有技术深度?对某个领域是否真正有价值?还是纯粹噪音与广告推广?

可接入的模型阵容很广:Claude、GPT、Gemini、DeepSeek、豆包、MiniMax,以及任何兼容 OpenAI 的 API。甚至还能自行指定 base_url,接入本地模型。

去重与背景加持
不同平台常常重复报道同一件事。在生成日报前,Horizon 会自动将指向同一故事或同一 URL 的内容合并,你不会看到三条重复的“GPT-5 发布”。此外,遇到不熟悉的术语、公司或项目,Horizon 会通过网络搜索补上背景解释。比如某条新闻提到一个冷门开源项目,日报中会自动附上一段“它是什么”的说明。
社区讨论也不落下
对于 Hacker News 和 Reddit 这类带有评论功能的信源,Horizon 不只是抓取正文,还会拉取热门评论并生成摘要。很多时候,一条高赞回复比原文更有价值——如果丢掉这些信息就太可惜了。
Ideogram 4.0 开源设计模型:9.3B参数,24GB显存,文字渲染超越80B级


#Ideogram4 #开源图生模型 #DiT
凭借 9.3B 参数,Ideogram 4.0 展现出顶级设计生成实力,其图像内文字渲染能力甚至超越了某些 80B 参数的大模型,并且通过 JSON 结构化提示词,设计师能够精细调整构图、色彩与排版。经过 NF4 量化后,该模型仅需 24GB 显存即可在本地运行。
- 9.3B 参数量 | #1 开源设计模型 | 24GB 最低显存
Ideogram 4.0 是多伦多 AI 初创公司 Ideogram 推出的首个开源权重文生图模型,于 6 月 3 日正式上线。因其在文字渲染、版面精度和设计品质方面的出色表现,被社区公认为当前最强大的开源图生设计模型。
该模型并非基于任何现有模型的微调,而是完整的 Flow-Matching Diffusion Transformer(DiT),拥有 9.3B 参数、34 层 Transformer 结构,文本与图像 token 共享同一序列空间。正是这一架构选择,使其以仅 9.3B 的参数量,在文案渲染和排版控制等设计关键指标上超越了某些 80B MoE 架构的大模型。
整个管线分为四层:冻结的视觉语言编码器、处于训练状态的 DiT 主干、运行时的流匹配采样器以及同样冻结的 KL VAE 解码器。实际接受训练的仅有中间这 9.3B 参数的 DiT 模块,编码器与解码器则复用已有的预训练组件。
在文本编码方面,模型并未采用 CLIP 或 T5 等传统选项,而是选择了 Qwen3-VL-8B-Instruct 视觉语言模型。Ideogram 从该 VLM 的 13 个中间层抽取隐状态,并将它们拼接后送入 DiT,从而获得了远比单层 CLIP embedding 更丰富的语义理解。这也是它能够出色处理复杂排版指令的关键所在。
Java Integer 判等陷阱深度复盘:为什么 168≠168 差点引发生产事故?
前阵子组里来了个新人,我分配给他一个看起来非常简单的任务。
我们团队固定在每周四上线发版,按照惯例,上线前两天会进行集体代码评审。那次评审也顺利通过了——功能本身很直接,大家都没有太细看。
但从业这么多年,我一直保持着上线前再做一次独立代码审查的习惯,这个习惯确实救过不少次场。
就在最后一遍过代码的时候,IDEA 突然弹出一个智能提示,我当时心里就“咯噔”一下:

我心里很清楚,如果这次二次复查没有发现这个问题,后续的麻烦绝不是小事。正是这次经历促成了这篇文章的整理。
一个“简单”代码段的反直觉表现
各位 Java 开发者不妨先停下想一想:执行下面这段代码后,控制台会输出“不相等”吗?
public static void main(String[] args) {
Integer total = 168;
Integer count = 168;
if (total != count) {
System.out.println("不相等!!!");
} else {
System.out.println("相等!");
}
}
很多人第一反应就是:两个变量的值都是 168,那结果肯定是“相等!”才对。
然而真实的运行结果却是:

它直接打印了“不相等”。
这种现象背后的根本原因
这个问题其实反映了 Java 中一个常见的认知模糊点,不只是新手,一些有几年经验的开发者也可能会掉进去:
int是基本数据类型,使用==比较的是数值本身;Integer是包装类,属于引用类型,==比较的是对象的内存地址。
也就是说,即便两个 Integer 对象里面保存的数值一模一样,只要它们不是同一个实例,== 就会返回 false。
这个坑正好解释了上面代码中 total != count 成立的原因——两个 168 的 Integer 对象在内存里指向不同的地址。
更让人困惑的“相等”情况
再来看另一段看似几乎一样的代码:
Integer total2 = 100;
Integer count2 = 100;
if (total2 != count2) {
System.out.println("不相等!");
} else {
System.out.println("相等!");
}
猜猜这次会打印什么?
MiniMax M3新套餐值不值?6亿Token月付49元,全面对比告诉你答案
6月1日,MiniMax官方发布公告,正式推出新模型M3,同步启动了M3按量API限时7天的5折优惠活动。同时,平台还对Token Plan订阅套餐价格体系进行了全面升级,将原来的6种套餐精简为3种主流订阅方案。
MiniMax M3模型核心能力一览
M3是一款集前沿编程能力、1M超长上下文窗口以及原生多模态处理能力于一身的大模型,MiniMax官方宣称,它是目前市面上唯一能同时满足这三项要求的开源模型。

在编程能力方面,M3在SWE-Bench Pro测试中斩获59.0%的成绩,超越了GPT-5.5和Gemini 3.1 Pro,逼近Opus 4.7;在SVG-Bench上甚至反超Opus 4.7;在Agent评测Claw-Eval中同样拔得头筹。
单从跑分数据看,M3的进步毋庸置疑。但关键问题在于:在如今竞争激烈的市场格局下,这样的性能提升是否对得起它的定价?
国产模型竞品能力横向对比
把MiniMax M3放在国内顶级模型里,究竟处于什么水平?

对比结果表明,M3的59.0%得分虽然很有竞争力,但Qwen3.7-Max已在开发者社区投票的Code Arena中取得了1541分,超越了GPT-5.5和GLM-5.1;GLM-5.1则稳坐全球开源模型编程榜第一。M3在能力上并未明显甩开国内顶尖对手,价格反而上涨了不少。
新旧套餐对比:品种精简,价值升了吗?
将原来的六种套餐精简为三种,显著降低了用户的选择难度。Plus、Max、Ultra三档定位明确,分别面向个人开发者、日常专业用户以及重度高频使用场景,方便按需选择。

但核心问题来了:同样是¥49/月,用户要接受的改变是什么?
旧版Plus套餐(¥49)提供“每5小时1500次调用”,按照编程场景估算约合3.6亿Token/月。新版Plus套餐(¥49)则直接提供6亿Token/月。计费口径从调用次数转变为Token总量,但实际价值是否提升,还要结合具体使用场景来看。
M3 API限时5折:窗口期与长期性价比分析
5折体验真香,原价可能劝退:5折活动期是尝鲜M3的理想时机,一旦恢复原价,性价比将大幅缩水。
| 模型 | 输入价格 | 输出价格 | 缓存读取 |
|---|---|---|---|
| MiniMax-M3(≤512k,五折) | 2.10 | 8.40 | 0.42 |
| MiniMax-M3(≤512k,原价) | 4.20 | 16.80 | 0.84 |
| MiniMax-M3(>512k,原价,限量) | 8.40 | 33.60 | 1.68 |
| MiniMax-M2.7 | 2.10 | 8.40 | 0.42 |
| MiniMax-M2.7-highspeed | 4.20 | 16.80 | 0.42 |
🔹 M3五折后价格与M2.7完全一致(2.10元/百万输入,8.40元/百万输出)
🔹 原价恢复后,M3比M2.7贵一倍(4.20 vs 2.10)
🔹 超过512k上下文目前限量供应,价格翻倍(8.40/33.60)
全新Token Plan与市场竞品一览
下图展示了全新Token Plan与市场上主要竞品的套餐对比:

到底值不值?分场景购买指南
| 你的情况 | 推荐 | 理由 |
|---|---|---|
| 日常AI编程,月用量几千万tokens | MiniMax M3 Plus套餐 | 6亿Token,47倍于按量,多模态白送 |
| 想尝鲜M3,但不确定用量 | 7天内用五折API | 五折价与M2.7持平,灵活试水 |
| 追求无限制、生产环境 | 小米/DeepSeek API | 无套餐限制,永久低价 |
| 需要视频生成 | MiniMax Max套餐 | 每日3条视频,业内唯一 |
| 轻度用户(月<1000万) | M3五折API | 用多少付多少,不浪费 |
最终建议:
🔹 日常重度AI编程(月消耗超2000万Token):首选MiniMax M3 Plus套餐,性价比碾压。
🔹 无限制生产环境需求:推荐小米或DeepSeek API,缓存命中价格低至0.025元/百万Token。
🔹 仅想尝鲜M3:利用7天5折API窗口,灵活试水。
NAS部署Tomcat实战:轻松运行Java Web项目(WAR/HTML/JAR全解析)
Apache Tomcat 是一款开源、免费的轻量级 Java Web 应用服务器,主要用于运行 Servlet 和 JSP 程序,常被用来部署 Java 网站和接口服务。简单来说,别人用 Java 开发并打包好的程序,放到 Tomcat 里就能直接在服务器上跑起来。

利用 Docker Compose 快速安装 Tomcat
以下是推荐的 Compose 配置:
services:
tomcat:
image: tomcat:9.0
container_name: tomcat
volumes:
- ./webapps:/usr/local/tomcat/webapps
ports:
- 8080:8080
restart: unless-stopped
几个关键参数说明(更多细节建议查阅官方文档):
- 镜像标签
9.0:适配 Java 8,大多数企业项目和旧系统都采用这一版本。 - 容器内路径
/usr/local/tomcat/webapps:默认的应用部署目录,所有要运行的项目文件最终都要放到这里。
初次访问与 404 现象
服务启动后,在浏览器输入 http://NAS的IP:8080 就能打开 Tomcat 页面。

如果看到 404 错误,这是正常情况。因为此时
webapps路径下还没有ROOT目录,Tomcat 找不到默认页面,所以返回 404。

如何恢复官方演示 Demo
Tomcat 镜像里其实内置了一个演示应用,如果想让首页出现熟悉的欢迎画面,可以按下面的步骤操作。

首先进入 Tomcat 容器的终端。
NAS一键部署MicroWARP:轻量WARP SOCKS5代理实现Docker网络自由
为什么你的NAS Docker应用总是连不上?
在NAS上运行Docker时,常常会碰到这些让人头疼的问题:
- 拉取镜像如同蜗牛,甚至直接失败;
- 需要访问海外API的容器,时不时断线;
- 服务看起来在正常运行,但更新、同步、订阅以及对外接口调用的速度与稳定性都大打折扣。
过去我曾分享过Mihomo的部署方案,它适合做全局的代理管理和规则分流。但对于大多数NAS用户来说,需求远没有这么复杂——只是想让某几个特定的Docker应用能够顺畅地下载镜像、更新订阅或访问外部API,而不是改变整台NAS的网络架构。

有没有更轻量的办法?今天要介绍的MicroWARP,就是这样一个方案:通过Docker在NAS上运行一个WARP SOCKS5代理,按需为特定的容器提供干净的出口网络。简单说,它不搞复杂的分流规则,只专心做好“落地出口”。
⚠️ 安全提醒:此代理服务默认仅供本地使用。如果必须开放到公网,请务必设置复杂的用户名和密码,避免被他人滥用。
为什么选择MicroWARP?
完整项目仓库为 ccbkkb/MicroWARP,可通过GitHub搜索获取。如果你需要其他平台的版本,可以切换到仓库的next分支自行构建,但记得准确指定镜像Tag。
市面上常见的WARP镜像(比如 caomingjun/warp)大多依赖Cloudflare官方的 warp-cli 守护进程,这通常会带来约150MB以上的内存占用,且在高并发场景下容易出现性能瓶颈。
MicroWARP 则采用了完全不同的底层设计:
- 内核级WireGuard:直接利用Linux原生内核态的
wg0接口处理流量,CPU损耗几乎为零。 - 轻量服务组件:核心部分由小型C语言程序构成,长时间运行资源消耗极低。
- 极低内存占用:高并发下内存用量依旧控制在5MB以内(实测常驻仅800KB左右),特别适合资源受限的设备。
- 原生兼容Tailscale:智能保留回程路由,避免全局接管造成的非对称路由黑洞,与异地组网直连完全兼容。
- 多架构支持:原生支持
amd64和arm64,完美覆盖各类ARM平台的NAS。
部署流程
下面以威联通NAS为例,通过Docker Compose的方式完成MicroWARP的部署。
完整的 docker-compose.yml 配置如下:
services:
microwarp:
image: ghcr.io/ccbkkb/microwarp:latest
container_name: microwarp
restart: always
ports:
- "0.0.0.0:1080:1080" # 监听所有IP
cap_add:
- NET_ADMIN
- SYS_MODULE
sysctls:
- net.ipv4.conf.all.src_valid_mark=1
environment:
- SOCKS_USER=ydxian # 如果监听任意IP,建议设置用户名
- SOCKS_PASS=qnap1234 # 务必配置强密码
volumes:
- /share/Container/microwarp/warp-data:/etc/wireguard
logging:
driver: "json-file"
options:
max-size: "3m"
max-file: "3"
作者还提供了一些进阶环境变量,可按需添加,例如用于自定义WARP端口或开启调试日志等。
Open Design:40K Star的开源设计神器,免费替代Claude Design,本地运行不依赖云端
4 月 17 号,Anthropic 推出了 Claude Design——只需一句需求描述,就能直接生成可交互的 HTML 设计稿。无需 Figma,不用 Photoshop,甚至不需要任何设计基础。
设计圈瞬间沸腾。
但热度过后,现实泼了一盆冷水:闭源、仅限付费用户、数据必须上传 Anthropic 云端、模型锁定为 Opus 4.7、不支持自托管、不能更换模型。
仅仅十一天之后,nexu.io 创始人 Tom Huang 在 GitHub 上发布了 Open Design。五天冲到 18K Stars,目前已经来到 40.8K Stars、4.6K Forks。采用 Apache-2.0 协议,完全免费。

它没有重新造一个 Agent,而是巧妙地把你电脑上现有的编码 Agent,直接转化为设计引擎。
Open Design 是什么

简单来说:给 Claude Code、Codex、Cursor、Gemini 这类 CLI 工具包上一层设计工作流,让它们像专业设计师一样输出网页原型、PPT、移动端界面和视觉物料。

可以把它看作“Claude Design 的开源复刻”,但架构迥异。Claude Design 是一个封闭的 SaaS 产品,Open Design 则运行于本地,以 daemon + web 应用的形式,使用你自己的 API Key,驱动你自己的 Agent,数据始终不离开硬盘。

技术栈基于 Next.js 16 + Express + SQLite,既可以部署到 Vercel,也能完全在本地运行。
OpenAI Codex全员AI工作台登场:六大角色插件、Sites建站与Annotations精修,9亿用户零代码拥有AI员工
2026年6月2日深夜,OpenAI的一场直播完全打破了外界的预期。没有新模型发布,也没有花哨的PPT,唯一的主角是Codex——可这一次,它已不再是程序员的专属玩具。
一、500万周活背后,一个反直觉的信号
先来看一组 OpenAI 官方公布的数字:
| 指标 | 数据 | 来源 |
|---|---|---|
| Codex 周活跃用户 | 500万+ | OpenAI 官方公告 2026-06-02 |
| 较年初增长倍数 | 8倍 | 澎湃新闻/智东西 2026-06-03 |
| 非开发者占比 | 约20% | OpenAI 官方博客 2026-06-02 |
| 非开发者增速 vs 开发者 | 3倍以上 | OpenAI 官方博客 2026-06-02 |
最后两行让我愣了一下。
五分之一的Codex用户根本不写代码。 他们来自分析师、营销、运营、设计、研究、投资和投行等岗位。更令人吃惊的是,这群非开发者用户的增速是开发者的3倍还多。
这意味着什么?
Codex早已不是“程序员专用工具”。它正快速蜕变成一台全员AI工作台。
而这,恰恰就是6月2日直播中 OpenAI 一口气放出三大更新的底层逻辑。
二、三大更新,一次性补齐关键短板
更新一:六大角色专属插件——零代码打造“AI员工”
OpenAI一次发布了六款角色插件,每一款都打包了该岗位日常工作所需的应用、技能、指令和工作流:
| 插件名称 | 目标用户 | 集成工具 | 核心能力 |
|---|---|---|---|
| 数据分析 | 分析师、业务团队 | Snowflake、Databricks Genie、Hex、Tableau | 数据探索、指标归因、自动生成报告和仪表盘 |
| 创意生产 | 营销、创意团队 | Figma、Canva、Shutterstock、Picsart、Fal | 将创意简报转化为可审阅物料,制作广告变体 |
| 销售 | 销售团队 | Salesforce、HubSpot、Slack、Outreach、Clay、Rox、Actively | 锁定高优先级客户、会前准备、跟进、CRM更新、识别流失风险 |
| 产品设计 | 产品、设计团队 | Figma、Canva | 从想法到原型、交互流程审查、静态截图→可交互原型 |
| 公募股权投资 | 基金经理、分析师 | Moody’s、Daloopa、Datasite、FactSet、LSEG、S&P、PitchBook、Hebbia | 财报审阅、公司对比、信号追踪、投资论点验证 |
| 投资银行 | 投行分析师 | 可信数据提供商 | 路演材料、可比公司分析、尽调→建议输出 |
关键数据:6大插件、62款应用、110项技能,全部无需编写代码即可使用。