Hermes Agent与OpenClaw双修全攻略:从原理到安装,一文读懂自我进化型AI Agent

本文概览
第一部分 解密 Hermes Agent:会自学的 AI 助手
第二部分 Hermes 与 OpenClaw 架构对比
第三部分 手把手安装 Hermes Agent
第四部分 如何选择:Hermes 还是 OpenClaw?
第五部分 总结与思考
全文约4000字,阅读约需10分钟。
OpenClaw(常被称作“龙虾”)的浪潮还未平息,Hermes Agent 已强势入场。AI 圈永远没有空窗期,只有不停歇的更新迭代。
这款由 Nous Research 推出的开源项目,采用 MIT 许可证,主打开源优先和去中心化理念,迅速吸引了大量原本使用“龙虾”的用户,将目光投向了它。

第一部分:解密 Hermes Agent:会自学的 AI 助手
Hermes Agent 最亮眼的设计在于,它试图打造一个 越用越聪明的 AI 代理,并内建了完整的学习循环。
多数 Agent 框架遵循“接收任务 → 规划 → 执行 → 返回结果”的流程,而 Hermes 在这条链路的末端,额外植入了关键步骤:
接收任务 → 规划 → 执行 → 评估 → 提取模式 → 生成技能 → 下次更优
这个自我改进的闭环,让 Agent 每次完成任务后,都会自动将成功的执行过程提炼为可复用的“技能(Skill)”,下次碰到类似任务直接调用,并在使用中持续优化。
大约每处理 15 个任务,Hermes 就会主动回顾一次自身表现,更新技能库。使用时间越长,它在高频任务上的表现就越有可能变得愈发顺手。
跨会话的用户建模
Hermes 另一个重要特征是能够跨会话记住用户,持续记录使用者的偏好、决策习惯和任务模式,逐步构建出个人化的使用画像。
技术架构区别
和 OpenClaw 以 Gateway 中央控制器为核心不同,Hermes 更侧重 Agent 本身的执行循环。网关、调度器、工具运行时、ACP 协议等模块,全都围绕这个循环来组织。
它基于 Python 构建,原生支持函数调用,模型直接输出结构化数据,无需额外解析层,执行路径也更为直接。
模型支持
Hermes 支持 Kimi、MiniMax、GLM 等国内大模型,以及 OpenAI 等国外模型。如果你希望完全本地部署,也可以通过 Ollama 调用 Qwen、Llama 等模型。
消息渠道
支持的渠道包括 CLI 命令行、国内主流应用(微信、企业微信、飞书、钉钉),以及 Telegram、Discord、Slack、WhatsApp 等海外平台。而且它强调跨渠道的对话连续性——你在一个平台上安排的任务,可以切换到另一个平台接着处理。
第二部分:Hermes 与 OpenClaw 架构对比

Hermes 强调“智能分层 + 自动提炼”的自我进化记忆,像大脑一样主动学习、压缩、建立用户模型;OpenClaw 则采用“透明 Markdown 文件 + 人工可控”的显式记忆。在持久记忆、安全性和自主进化能力上,Hermes 的优势更明显。
| 维度 | OpenClaw | Hermes Agent |
|---|---|---|
| 核心架构 | Gateway 中央控制器(Node.js) | 以 Agent 执行循环为中心(Python) |
| 技能机制 | 静态文件,可由用户安装或编写 | 自主生成,持续自我优化 |
| 记忆方式 | Markdown 文件,灵活且可编辑查看 | 有 token 上限,主动精简,避免膨胀 |
| 模型支持 | 主流模型(Claude、GPT、Gemini 等) | 200+ 模型,本地部署友好 |

OpenClaw 在每次对话结束后,由 Agent 自行判断哪些内容重要,并将其追加到本地的 Markdown 文件里。SQLite 则负责全文搜索,帮助 Agent 在下一次会话中找到相关上下文。整套体系对用户完全透明,你可以像管理普通文档一样,直接打开、查看、编辑或删除这些记忆文件。
不过,这种机制的关键特点是无上限、不主动筛选。内容只会不断累积,Agent 自身不会剔除过时或无用的信息。长此以往,记忆文件会越变越大,若不定期手动清理,不仅占用空间,也会逐渐拖累检索质量。

Hermes 的记忆系统则是一套包含四层分层与自动提炼的主动管理机制,其核心目标是让 Agent 越用越懂你、越用越省 token。它主要由以下几个部分构成:
- 持久笔记层(MEMORY.md + USER.md):形式上类似 OpenClaw 的文件,但 Agent 会在每次任务结束后自己评估、提取关键模式,并把精华内容主动写入,用户无需手工打理。
- 会话历史搜索层:所有对话都存入 SQLite 数据库,支持 FTS5 全文搜索;过往对话会被大模型自动汇总压缩,只在需要时注入相关片段,从而避免上下文爆炸式增长。
- 程序性记忆层(技能库):这是 Hermes 最独特的地方。任务成功后,它会自动把“如何执行”的流程提炼为可复用的技能模板并存储下来,以后可以直接调用。
- 用户模型层:这是一个可选的 Memory Provider 插件(Honcho),默认不开启。开启后,会在这三层记忆之上叠加“辩证推理”,持续构建关于“你是谁”的深层模型(包括偏好、决策习惯、沟通风格等)。它支持自动压缩与周期性自我评估,每隔一段时间主动“助推”优化记忆。
此外,还有一种 Nudge 机制将这四个层级串联起来:大约每完成 15 个任务,Agent 就会主动审视自身表现,检查哪些技能需要更新,哪些旧知识应该淘汰。这种定期的“自我整理”有效避免了系统的僵化。
OpenClaw 更强调生态与协同,适合需要多 Agent、强执行力、强路由的场景。
Hermes 则更侧重记忆与成长,适合希望 Agent 持续理解你、适应你、贴近你工作方式的场景。
第三部分:手把手安装 Hermes Agent
- 操作系统:支持 Linux、macOS、WSL2;原生 Windows 暂不支持,需要先安装 WSL2。
- 唯一前置依赖:确认已安装 git。
其余依赖均由安装脚本自动处理,包括:
uv(快速 Python 包管理器)
Python 3.11(通过 uv 安装,无需 sudo)
Node.js v22(用于浏览器自动化和 WhatsApp 桥接)
ripgrep(快速文件搜索)
ffmpeg(TTS 音频格式转换)
如果你已经安装了 OpenClaw(龙虾),可以完全交给它来代为安装 Hermes。
一键安装
Linux / macOS / WSL2 / Android Termux 下执行:
curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash
安装完成后:
source ~/.bashrc # 或 source ~/.zshrc
hermes # 直接启动聊天
配置模型与初始化
安装完毕,可直接运行配置向导:
hermes setup # 一键配置所有选项(推荐初次使用)
# 或分步配置:
hermes model # 选择 LLM 提供商和模型
hermes tools # 配置启用哪些工具
hermes gateway setup # 配置消息平台(微信、飞书等)
hermes model 支持的提供商包括:OpenRouter(200+ 模型)、Nous Portal(400+ 模型)、OpenAI、Google AI Studio、xAI(Grok)、Kimi、MiniMax,以及通过 Ollama 运行的本地模型。
验证安装
hermes version # 确认命令可用
hermes doctor # 诊断检查,验证所有依赖是否正常
hermes status # 查看当前配置
hermes chat -q "Hello! What tools do you have available?" # 快速测试
微信连接步骤
Hermes Agent(v0.8.0 及更高版本)原生支持连接个人微信,利用腾讯 iLink Bot API。它支持私聊与群聊,可收发图片、视频、文件、语音等全媒体消息,并会自动将 Markdown 转换为微信友好格式。
在设置向导中选择 Weixin 或 WeChat 后,系统会生成二维码,扫码登录即可。成功后,相关凭证会保存在本地目录中。
在终端执行(确保 Hermes 已安装):
pip install aiohttp cryptography
# 可选:在终端直接显示二维码(推荐)
pip install qrcode
-
运行设置向导(推荐,一键完成):
hermes gateway setup- 用上下箭头选中 Weixin(或 WeChat),按空格确认。
- 向导会自动从 iLink Bot API 请求二维码。
- 终端会出现二维码(或链接),用手机微信扫码 → 确认登录。
- 成功后提示:微信连接成功,account_id=xxxxxxxx
所有凭证自动保存到
~/.hermes/weixin/accounts/文件夹。 -
配置环境变量(向导已处理大部分,只需检查)
打开或创建文件:nano ~/.hermes/.env至少确保包含以下内容(向导已自动填入 account_id):
WEIXIN_ACCOUNT_ID=你的account_id # 必填 -
启动网关(后台常驻)
hermes gateway看到类似 “Weixin adapter connected, long-polling started” 即代表成功。
- 直接在微信里私聊或 @机器人 发消息,它便会响应、执行任务并生成技能。
- 支持语音转文字(可选)、图片/文件上传下载等。
- 跨平台连续性:在微信里开始的任务,可在 Telegram/Discord 继续,记忆完全同步。
注意事项与常见问题
- 群聊默认关闭:要启用群聊,需手动设置
WEIXIN_GROUP_POLICY=open或添加白名单。 - 只能运行一个实例:同一个微信账号仅能启动一个 Hermes 网关。
- 二维码过期:扫码失败时,重新执行
hermes gateway setup。 - 依赖缺失:若提示 “aiohttp/cryptography not found”,重新运行
pip install。
第四部分:如何选择:Hermes 还是 OpenClaw?
Hermes Agent:以单 Agent 不断进化为核心,强调“越用越聪明”。
OpenClaw:以多 Agent 协同为核心,侧重“工具协作与生态扩展”。
若在两个之间犹豫,可以直接从使用目标出发。
优先考虑 OpenClaw,如果你:
- 对工具执行力要求很高:依赖大量社区现成技能,需要浏览器、Shell、邮件、日历等复杂操作,追求即插即用的执行能力。
- 所有操作必须显式授权、可审计、透明(技能就是 Markdown 文件,一目了然)。
- 需要多 Agent 协作:多个不同 Agent 互相配合、复杂路由、跨平台自动化。
优先考虑 Hermes Agent,如果你:
- 任务需要“记忆与成长”,例如长期项目管理、个人知识库搭建、自动化工作流优化。需要跨会话记忆、用户画像建模、个性化(比如记住你的写作风格或项目上下文)。
- 在意数据隐私,更倾向于完全本地化运行。
- 喜欢尝试不同模型,希望在成本和效果之间灵活切换。
两者也可以双修:
如果你长期深度使用 Agent,一种很实用的组合方式是:
- OpenClaw 负责广度:消息路由、自动化执行、跨平台操作。
- Hermes 负责深度:记忆积累、技能沉淀、长期学习。
第五部分:总结与思考
OpenClaw 已经证明,自主 AI Agent 完全可以承担自动化工作流与 7×24 小时跨平台运行,它定义了这个方向的基本边界。
而 Hermes 则在追问另一个问题:如果 Agent 本身足够强大,为何还要依赖外部系统不断修补?它能否把复杂性直接内化进模型自身?这一思路能否经受住时间的检验,还需要更长周期的观察。但对那些日复一日处理相似任务,并真切渴望工具能“越用越顺手”的人而言,Hermes 所代表的方向,值得认真关注。