Hermes 爆火背后:OpenClaw 的挑战与自改进AI Agent的未来
近期,Hermes 在AI社区中迅速走红,甚至有观点声称 OpenClaw 已经过时。这种说法或许是为了吸引流量,但 Hermes 的实际表现确实值得关注。我在上周通过 X 平台了解到这一工具,并在周一出于好奇进行了初步体验。

说实话,我最初并未深入使用,仅尝试用它操控了龙虾。当时的直观感受是其可观测性表现优异,能够清晰暴露所调用的工具。每一步点击了什么、运行了哪些命令、获得了什么返回结果,都在对话界面中完整展示,不像某些 Agent 那样存在严重的黑箱感。
工作过程透明,信任感才能稳固建立。

OpenClaw 是否真的落伍?需审慎判断
首先明确结论,我不同意 OpenClaw 已死的说法。OpenClaw 并非功能不足,ClawHub 上拥有超过五万个 Skill 和数千万用户基础,这不是一个新项目在短期内能够轻易动摇的。然而,我也不会为 OpenClaw 辩护。最近一段时间,我对 OpenClaw 的主要感受可以归结为一个字:烦。
具体烦恼在于每次版本迭代都可能引入新的稳定性问题。例如,今天我刚升级了版本,启动时 Gateway 再次无法正常运行。随后便是熟悉的一套流程:查看日志、手动调整配置、重新安装依赖,一番操作下来耗时耗力。这种定期出现的修复需求,久而久之确实令人感到疲惫。

OpenClaw 的设计理念不佳吗?并非如此。SOUL.md 所倡导的配置即行为哲学,我至今仍认为是一项巧妙的设计。但一个工具无论多么智能,如果每次升级都需要用户花费大量时间去修复问题,那么它就不是在协助工作,而是在增加负担。
因此,Hermes 的流行并非意味着 OpenClaw 彻底失败,而是反映了部分用户开始厌倦频繁的调试,寻求更简便的替代方案。
Hermes 的核心优势:我最关注的两个特性
关于 Hermes 的架构亮点,许多技术文章已有全面阐述,我不再重复。这里仅聚焦于两个我真正在意的关键点。

自改进技能系统
OpenClaw 的 Skill 并非只能手动编写,用户完全可以指示其自动创建。但前提是用户必须明确发出指令。例如,当你说“将刚才的流程保存为 Skill”,它才会执行;如果你不提出要求,它不会主动提供此功能。Skill 的进化同样如此,需要用户推动才能进行。
Hermes 则不同,它具备自主判断能力。在完成一项任务后,只要系统判定该任务足够复杂且值得复用,便会自动将其提炼为一个 Markdown 文件,存储在 ~/.hermes/skills/ 目录中。下次遇到类似指令时,直接调用该 Skill。更令人印象深刻的是,在收到用户反馈后,Hermes 会主动修改 Skill 文件本身,而不仅是在当前对话中记住,而是永久性地写入文件。
这一特性的重要性在于,日常使用 Agent 时,80% 的时间可能都在重复交代同一类任务。例如,“这个 PR 的提交信息需要这样编写”、“该项目的部署脚本需先检查端口”。这些经验若每次都需要重新说明,无疑是在浪费注意力。Hermes 的思路是让 Agent 自行记录笔记,而不是让用户持续扮演教师的角色。
双层记忆架构
首先需要公正地指出,OpenClaw 并非健忘。它配备了 Daily Logs、MEMORY.md 和语义搜索等功能,记忆能力并无问题。但实际使用中,其维护成本较高。
Hermes 在记忆处理上显得更为克制。它将记忆架构分为两个层级,各自负责不同时段:
- L1 持久记忆:包括 MEMORY.md(Agent 的笔记)和 USER.md(用户画像)。在会话开始时,这些内容作为冻结快照一次性注入系统提示中,整个会话期间保持不变。
- L2 历史会话搜索:全部会话记录存储在 SQLite 数据库中,配合 FTS5 全文索引。仅在需要回忆“上周是否讨论过 XX”时才主动检索,而非将所有历史记录一股脑塞入提示中。
值得注意的是 L1 的“冻结快照”设计,这不是在推理过程中随意修改的内存,而是固定的快照。容量也被限制,超出时由 Agent 自行压缩,避免无限追加。
这一设计体现了 Hermes 在工程上的克制。对于熟悉 Agent 开发的人来说,记忆系统最容易出问题的地方往往是“边推理边写入”。模型在思考过程中不断将想法加入提示,几轮下来提示可能被自身污染,导致 Agent 行为不稳定。
Hermes 的处理方式是:记忆仅在会话开始时注入一次,中间阶段保持不变。如需更新,则等待会话结束后由 Agent 统一整理。
此外,Hermes 还支持第三层记忆,即可外接 Mem0 等记忆提供者进行跨会话用户建模。这一功能我尚未深入体验,后续将单独撰文探讨。
顺便提及一个小彩蛋。近期,Karpathy 分享了一种 LLM Wiki 笔记方法,核心思路是利用大语言模型与 Obsidian 构建个人知识库和研究库。

这一工作流程原本是他在 X 平台上分享的个人经验,但 Nous Research 迅速将其集成为 Hermes 的内置 Skill,安装后即可使用,无需用户自行复制操作。

这种“社区出现创意 → 迅速转化为内置功能”的速度,在开源 Agent 领域中并不常见。这也侧面证明了 Hermes 的技能系统是活跃的。不仅用户在使用过程中能生成 Skill,官方也在持续集成优质资源。作为一个经常使用 Obsidian 管理知识库的用户,看到这一内置 Skill 时确实感到兴奋。
OK,原理部分就探讨到这里,接下来进入实践安装环节。
安装指南:一行命令快速部署
我在本地 MacMini 上进行了安装,其他平台流程类似,可参照执行。打开终端,粘贴以下命令并回车:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装过程中,系统会提示是否从 OpenClaw 迁移数据。建议选择迁移,以便将 OpenClaw 中的所有记忆和 Skill 自动导入 Hermes Agent。我之前在 OpenClaw 中编写的 SOUL 配置和积累的记忆,在此步骤中均被自动转移,仅需几秒钟。

这一设计是 Hermes 最令人印象深刻的“智能”之处。传统工具迁移最困难的部分往往不是安装新工具,而是担心配置丢失、数据遗失,导致前期投入白费。Nous Research 直接降低了这一心理门槛,用户并非更换工具,而是在升级引擎。
随后根据向导配置大模型。

这里我选择了国产的 MiniMax 模型。

具体型号为 MiniMax-M2.7-highspeed。该模型目前性价比较高,响应速度快且中文支持良好。

事实上,配置完模型后,直接在终端中输入 hermes 命令,即可启动 Hermes Agent。

不知大家是否注意到,我的 TUI 界面与官方文档有所不同,其实我自定义了一个皮肤,通过 /skin 命令即可更换。

这里还有一个值得单独提及的好消息。使用过 Claude Code 的用户可能了解,前段时间 Anthropic 开始大规模封杀通过 Claude 订阅访问 Claude 模型的第三方工具,许多 Agent 框架受到影响。但 Hermes 目前尚未被封禁。我实际测试发现,使用 Claude Pro 会员登录态配置后,能够正常运行,Sonnet 和 Opus 模型均可调用,不过这一窗口期能维持多久尚不确定。

我们可以验证一下 OpenClaw 迁移是否成功。Hermes 确实能输出我的相关信息,实现了无缝迁移。

集成飞书:快速配置指南
如果需要配置聊天工具,流程也非常简单,只需继续按照向导操作即可。

但是这里存在一个小问题:初始选择渠道时选项较少。

我们可以通过以下命令进入设置,查看支持的更多渠道:
hermes gateway setup

我最初尝试了微信集成,但体验不佳,回复呈现为分段形式。

最终选择了更熟悉的飞书。根据向导填写 App ID、App Secret,选择 Domain 为 feishu,连接模式为 WebSocket,即可完成配置。

配置完成后,即可在飞书上与 Hermes 进行交流。

首次发送消息时,Hermes 会回复一条配对提示。看到提示后,执行配对操作:将 Hermes 提供的 hermes pairing approve feishu xxxx 命令复制到终端运行,即可完成配对。

整个流程从安装到在飞书上正常使用,大约需要十分钟。

实用命令:提升使用效率的关键操作
飞书 Bot 配置成功后,使用过程中可能会遇到一些小摩擦。Hermes 其实内置了相应的解决命令,但官方文档中可能不易发现,新手容易忽略。我挑选三个个人体验最佳的命令进行介绍。
一、/yolo:启用懒人模式,一键免审批
Hermes 默认设置较为谨慎,遇到敏感操作时会弹出 /approve 确认请求,需要用户手动批准。


安全固然重要,但频繁的确认请求在使用久了后会显得烦人。特别是当整理 knowledge_base 目录时,删除临时文件也需要反复确认,五分钟内多次询问容易引发不满。
此时,直接输入:
/yolo

YOLO 模式一开后,所有命令将自动批准,Agent 将不再中断执行。但需注意,YOLO 模式意为“你只活一次”,暗示“出问题后果自负”。如果在生产服务器或重要项目中运行,切勿启用,一条 rm -rf 命令可能导致严重后果。我仅在个人环境的 MacMini 上启用,并将敏感目录单独隔离。
当然,若想重新启用审核,只需再次运行该命令即可。

二、/personality:切换聊天风格
Hermes 默认的回答风格偏向 helpful,礼貌且中规中矩,长期使用可能感到单调。实际上,它内置了 14 种不同人格。

使用 /personality 命令可以轻松切换:
用法特别简单,在对话中输入:
/personality technical

即可切换到技术专家模式。若想增加趣味性,可以尝试 kawaii 或 catgirl 风格,为调试过程增添乐趣。
这一设计颇受喜爱。Agent 作为日常频繁交流的工具,人格过于单一容易令人厌倦。能够像更换服装一样切换聊天风格,即使只是心理上的调剂,也能延长使用时间。这体现了 Hermes 作为陪伴型 Agent 的产品思路,它不仅是一个冰冷的命令执行器,更是一个可以协同工作的伙伴。
三、/reset 与 /resume:高效会话管理
第三个关键命令涉及会话管理。长期使用 Hermes 后,常会遇到两种情况:
情况一:对话卡住或偏离主题,希望重新开始一个干净的会话。
直接发送 /reset(或等效的 /new),Hermes 将立即清除当前上下文并启动新会话。同时,它会提示当前使用的模型和上下文窗口大小,非常贴心:

情况二:多线程工作,需要在多个话题间切换。
例如,上午与 Hermes 讨论 n8n 工作流,下午需要审核代码,晚上又想继续上午的话题。此时,命名会话就派上用场了。
流程如下:
/title n8n-workflow # 为当前会话命名
/reset # 重置并开启新会话
/title code-review # 为新会话命名
/reset # 再次重置
/resume n8n-workflow # 跳回上午的话题,上下文完整恢复
步骤看似繁多,但核心是三个命令:/title 命名 → /reset 开启新会话 → /resume 跳回。
需注意,/resume 可用的前提是已使用 /title 为会话命名。未命名的会话虽然会被保存,但恢复时需通过 session_search 查找,不够流畅。因此,若认为某个话题后续还需继续,建议先使用 /title 命名,养成习惯后不易丢失。
掌握这三个命令,Hermes 的日常使用将更加顺畅。随着使用深入,还会发现更多有趣功能,所有命令均可通过 /help 查看,建议多探索。
是否应该切换?理性选择建议
首先给出基本判断:OpenClaw 与 Hermes 并非互斥选择。我目前的策略是保留 OpenClaw 处理已稳定运行、需要精细控制的场景,同时试用 Hermes 作为新的主力工具,尤其适用于需要长期记忆和自改进的任务。无需二选一。
针对不同用户情况,建议如下:
-
如果你是 OpenClaw 老用户:强烈建议安装 Hermes 体验,即便仅为感受一键迁移的流畅性,也值得投入。它能在 10 分钟内搭建完整的 Agent 环境,且之前的投入不会白费。
-
如果你是 OpenClaw 新用户,仍在犹豫是否入门:建议跳过 OpenClaw 直接尝试 Hermes。原因并非 Hermes 功能更强,而是其学习曲线更短、部署更简便,上手后即可实用。OpenClaw 的 SOUL.md 深度配置能力,可在后续需要时再研究。
-
如果你从未接触过 Agent:Hermes 是一个不错的入门选择,它能实际执行任务。
总结与展望
在探索 OpenClaw 的过程中,我曾撰写多篇文章探讨其安全性、配置和多 Agent 架构,它确实是一个设计优雅的项目。如今观察 Hermes,我再次感受到熟悉的气息:开源社区正以不同思路推动每个项目向前发展。
OpenClaw 向我们展示了 Agent 可通过配置实现,而 Hermes 则尝试证明 Agent 能够自主成长。这两条路径最终是否会汇聚?尚不得知。但作为用户,拥有选择永远是一件好事。