Hermes 爆火背后：OpenClaw 的挑战与自改进AI Agent的未来

April 16, 2026

近期，Hermes 在AI社区中迅速走红，甚至有观点声称 OpenClaw 已经过时。这种说法或许是为了吸引流量，但 Hermes 的实际表现确实值得关注。我在上周通过 X 平台了解到这一工具，并在周一出于好奇进行了初步体验。

说实话，我最初并未深入使用，仅尝试用它操控了龙虾。当时的直观感受是其可观测性表现优异，能够清晰暴露所调用的工具。每一步点击了什么、运行了哪些命令、获得了什么返回结果，都在对话界面中完整展示，不像某些 Agent 那样存在严重的黑箱感。

工作过程透明，信任感才能稳固建立。

OpenClaw 是否真的落伍？需审慎判断

首先明确结论，我不同意 OpenClaw 已死的说法。OpenClaw 并非功能不足，ClawHub 上拥有超过五万个 Skill 和数千万用户基础，这不是一个新项目在短期内能够轻易动摇的。然而，我也不会为 OpenClaw 辩护。最近一段时间，我对 OpenClaw 的主要感受可以归结为一个字：烦。

具体烦恼在于每次版本迭代都可能引入新的稳定性问题。例如，今天我刚升级了版本，启动时 Gateway 再次无法正常运行。随后便是熟悉的一套流程：查看日志、手动调整配置、重新安装依赖，一番操作下来耗时耗力。这种定期出现的修复需求，久而久之确实令人感到疲惫。

OpenClaw 的设计理念不佳吗？并非如此。SOUL.md 所倡导的配置即行为哲学，我至今仍认为是一项巧妙的设计。但一个工具无论多么智能，如果每次升级都需要用户花费大量时间去修复问题，那么它就不是在协助工作，而是在增加负担。

因此，Hermes 的流行并非意味着 OpenClaw 彻底失败，而是反映了部分用户开始厌倦频繁的调试，寻求更简便的替代方案。

Hermes 的核心优势：我最关注的两个特性

关于 Hermes 的架构亮点，许多技术文章已有全面阐述，我不再重复。这里仅聚焦于两个我真正在意的关键点。

自改进技能系统

OpenClaw 的 Skill 并非只能手动编写，用户完全可以指示其自动创建。但前提是用户必须明确发出指令。例如，当你说“将刚才的流程保存为 Skill”，它才会执行；如果你不提出要求，它不会主动提供此功能。Skill 的进化同样如此，需要用户推动才能进行。

Hermes 则不同，它具备自主判断能力。在完成一项任务后，只要系统判定该任务足够复杂且值得复用，便会自动将其提炼为一个 Markdown 文件，存储在 ~/.hermes/skills/ 目录中。下次遇到类似指令时，直接调用该 Skill。更令人印象深刻的是，在收到用户反馈后，Hermes 会主动修改 Skill 文件本身，而不仅是在当前对话中记住，而是永久性地写入文件。

这一特性的重要性在于，日常使用 Agent 时，80% 的时间可能都在重复交代同一类任务。例如，“这个 PR 的提交信息需要这样编写”、“该项目的部署脚本需先检查端口”。这些经验若每次都需要重新说明，无疑是在浪费注意力。Hermes 的思路是让 Agent 自行记录笔记，而不是让用户持续扮演教师的角色。

双层记忆架构

首先需要公正地指出，OpenClaw 并非健忘。它配备了 Daily Logs、MEMORY.md 和语义搜索等功能，记忆能力并无问题。但实际使用中，其维护成本较高。

Hermes 在记忆处理上显得更为克制。它将记忆架构分为两个层级，各自负责不同时段：

L1 持久记忆：包括 MEMORY.md（Agent 的笔记）和 USER.md（用户画像）。在会话开始时，这些内容作为冻结快照一次性注入系统提示中，整个会话期间保持不变。
L2 历史会话搜索：全部会话记录存储在 SQLite 数据库中，配合 FTS5 全文索引。仅在需要回忆“上周是否讨论过 XX”时才主动检索，而非将所有历史记录一股脑塞入提示中。

值得注意的是 L1 的“冻结快照”设计，这不是在推理过程中随意修改的内存，而是固定的快照。容量也被限制，超出时由 Agent 自行压缩，避免无限追加。

这一设计体现了 Hermes 在工程上的克制。对于熟悉 Agent 开发的人来说，记忆系统最容易出问题的地方往往是“边推理边写入”。模型在思考过程中不断将想法加入提示，几轮下来提示可能被自身污染，导致 Agent 行为不稳定。

Hermes 的处理方式是：记忆仅在会话开始时注入一次，中间阶段保持不变。如需更新，则等待会话结束后由 Agent 统一整理。

此外，Hermes 还支持第三层记忆，即可外接 Mem0 等记忆提供者进行跨会话用户建模。这一功能我尚未深入体验，后续将单独撰文探讨。

顺便提及一个小彩蛋。近期，Karpathy 分享了一种 LLM Wiki 笔记方法，核心思路是利用大语言模型与 Obsidian 构建个人知识库和研究库。

这一工作流程原本是他在 X 平台上分享的个人经验，但 Nous Research 迅速将其集成为 Hermes 的内置 Skill，安装后即可使用，无需用户自行复制操作。

这种“社区出现创意 → 迅速转化为内置功能”的速度，在开源 Agent 领域中并不常见。这也侧面证明了 Hermes 的技能系统是活跃的。不仅用户在使用过程中能生成 Skill，官方也在持续集成优质资源。作为一个经常使用 Obsidian 管理知识库的用户，看到这一内置 Skill 时确实感到兴奋。

OK，原理部分就探讨到这里，接下来进入实践安装环节。

安装指南：一行命令快速部署

我在本地 MacMini 上进行了安装，其他平台流程类似，可参照执行。打开终端，粘贴以下命令并回车：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装过程中，系统会提示是否从 OpenClaw 迁移数据。建议选择迁移，以便将 OpenClaw 中的所有记忆和 Skill 自动导入 Hermes Agent。我之前在 OpenClaw 中编写的 SOUL 配置和积累的记忆，在此步骤中均被自动转移，仅需几秒钟。

这一设计是 Hermes 最令人印象深刻的“智能”之处。传统工具迁移最困难的部分往往不是安装新工具，而是担心配置丢失、数据遗失，导致前期投入白费。Nous Research 直接降低了这一心理门槛，用户并非更换工具，而是在升级引擎。

随后根据向导配置大模型。

这里我选择了国产的 MiniMax 模型。

具体型号为 MiniMax-M2.7-highspeed。该模型目前性价比较高，响应速度快且中文支持良好。

事实上，配置完模型后，直接在终端中输入 hermes 命令，即可启动 Hermes Agent。

不知大家是否注意到，我的 TUI 界面与官方文档有所不同，其实我自定义了一个皮肤，通过 /skin 命令即可更换。

这里还有一个值得单独提及的好消息。使用过 Claude Code 的用户可能了解，前段时间 Anthropic 开始大规模封杀通过 Claude 订阅访问 Claude 模型的第三方工具，许多 Agent 框架受到影响。但 Hermes 目前尚未被封禁。我实际测试发现，使用 Claude Pro 会员登录态配置后，能够正常运行，Sonnet 和 Opus 模型均可调用，不过这一窗口期能维持多久尚不确定。

我们可以验证一下 OpenClaw 迁移是否成功。Hermes 确实能输出我的相关信息，实现了无缝迁移。

集成飞书：快速配置指南

如果需要配置聊天工具，流程也非常简单，只需继续按照向导操作即可。

但是这里存在一个小问题：初始选择渠道时选项较少。

我们可以通过以下命令进入设置，查看支持的更多渠道：

hermes gateway setup

我最初尝试了微信集成，但体验不佳，回复呈现为分段形式。

最终选择了更熟悉的飞书。根据向导填写 App ID、App Secret，选择 Domain 为 feishu，连接模式为 WebSocket，即可完成配置。

配置完成后，即可在飞书上与 Hermes 进行交流。

首次发送消息时，Hermes 会回复一条配对提示。看到提示后，执行配对操作：将 Hermes 提供的 hermes pairing approve feishu xxxx 命令复制到终端运行，即可完成配对。

整个流程从安装到在飞书上正常使用，大约需要十分钟。

实用命令：提升使用效率的关键操作

飞书 Bot 配置成功后，使用过程中可能会遇到一些小摩擦。Hermes 其实内置了相应的解决命令，但官方文档中可能不易发现，新手容易忽略。我挑选三个个人体验最佳的命令进行介绍。

一、`/yolo`：启用懒人模式，一键免审批

Hermes 默认设置较为谨慎，遇到敏感操作时会弹出 /approve 确认请求，需要用户手动批准。

安全固然重要，但频繁的确认请求在使用久了后会显得烦人。特别是当整理 knowledge_base 目录时，删除临时文件也需要反复确认，五分钟内多次询问容易引发不满。

此时，直接输入：

/yolo

YOLO 模式一开后，所有命令将自动批准，Agent 将不再中断执行。但需注意，YOLO 模式意为“你只活一次”，暗示“出问题后果自负”。如果在生产服务器或重要项目中运行，切勿启用，一条 rm -rf 命令可能导致严重后果。我仅在个人环境的 MacMini 上启用，并将敏感目录单独隔离。

当然，若想重新启用审核，只需再次运行该命令即可。

二、`/personality`：切换聊天风格

Hermes 默认的回答风格偏向 helpful，礼貌且中规中矩，长期使用可能感到单调。实际上，它内置了 14 种不同人格。

使用 /personality 命令可以轻松切换：

用法特别简单，在对话中输入：

/personality technical

即可切换到技术专家模式。若想增加趣味性，可以尝试 kawaii 或 catgirl 风格，为调试过程增添乐趣。

这一设计颇受喜爱。Agent 作为日常频繁交流的工具，人格过于单一容易令人厌倦。能够像更换服装一样切换聊天风格，即使只是心理上的调剂，也能延长使用时间。这体现了 Hermes 作为陪伴型 Agent 的产品思路，它不仅是一个冰冷的命令执行器，更是一个可以协同工作的伙伴。

三、`/reset` 与 `/resume`：高效会话管理

第三个关键命令涉及会话管理。长期使用 Hermes 后，常会遇到两种情况：

情况一：对话卡住或偏离主题，希望重新开始一个干净的会话。

直接发送 /reset（或等效的 /new），Hermes 将立即清除当前上下文并启动新会话。同时，它会提示当前使用的模型和上下文窗口大小，非常贴心：

情况二：多线程工作，需要在多个话题间切换。

例如，上午与 Hermes 讨论 n8n 工作流，下午需要审核代码，晚上又想继续上午的话题。此时，命名会话就派上用场了。

流程如下：

/title n8n-workflow    # 为当前会话命名  
/reset                 # 重置并开启新会话  
/title code-review     # 为新会话命名  
/reset                 # 再次重置  
/resume n8n-workflow   # 跳回上午的话题，上下文完整恢复

步骤看似繁多，但核心是三个命令：/title 命名 → /reset 开启新会话 → /resume 跳回。

需注意，/resume 可用的前提是已使用 /title 为会话命名。未命名的会话虽然会被保存，但恢复时需通过 session_search 查找，不够流畅。因此，若认为某个话题后续还需继续，建议先使用 /title 命名，养成习惯后不易丢失。

掌握这三个命令，Hermes 的日常使用将更加顺畅。随着使用深入，还会发现更多有趣功能，所有命令均可通过 /help 查看，建议多探索。

是否应该切换？理性选择建议

首先给出基本判断：OpenClaw 与 Hermes 并非互斥选择。我目前的策略是保留 OpenClaw 处理已稳定运行、需要精细控制的场景，同时试用 Hermes 作为新的主力工具，尤其适用于需要长期记忆和自改进的任务。无需二选一。

针对不同用户情况，建议如下：

如果你是 OpenClaw 老用户：强烈建议安装 Hermes 体验，即便仅为感受一键迁移的流畅性，也值得投入。它能在 10 分钟内搭建完整的 Agent 环境，且之前的投入不会白费。
如果你是 OpenClaw 新用户，仍在犹豫是否入门：建议跳过 OpenClaw 直接尝试 Hermes。原因并非 Hermes 功能更强，而是其学习曲线更短、部署更简便，上手后即可实用。OpenClaw 的 SOUL.md 深度配置能力，可在后续需要时再研究。
如果你从未接触过 Agent：Hermes 是一个不错的入门选择，它能实际执行任务。

总结与展望

在探索 OpenClaw 的过程中，我曾撰写多篇文章探讨其安全性、配置和多 Agent 架构，它确实是一个设计优雅的项目。如今观察 Hermes，我再次感受到熟悉的气息：开源社区正以不同思路推动每个项目向前发展。

OpenClaw 向我们展示了 Agent 可通过配置实现，而 Hermes 则尝试证明 Agent 能够自主成长。这两条路径最终是否会汇聚？尚不得知。但作为用户，拥有选择永远是一件好事。