Hermes Agent与OpenClaw双修全攻略：从原理到安装，一文读懂自我进化型AI Agent

May 11, 2026

本文概览

第一部分解密 Hermes Agent：会自学的 AI 助手
第二部分 Hermes 与 OpenClaw 架构对比
第三部分手把手安装 Hermes Agent
第四部分如何选择：Hermes 还是 OpenClaw？
第五部分总结与思考

全文约4000字，阅读约需10分钟。

OpenClaw（常被称作“龙虾”）的浪潮还未平息，Hermes Agent 已强势入场。AI 圈永远没有空窗期，只有不停歇的更新迭代。

这款由 Nous Research 推出的开源项目，采用 MIT 许可证，主打开源优先和去中心化理念，迅速吸引了大量原本使用“龙虾”的用户，将目光投向了它。

第一部分：解密 Hermes Agent：会自学的 AI 助手

Hermes Agent 最亮眼的设计在于，它试图打造一个 越用越聪明的 AI 代理，并内建了完整的学习循环。

多数 Agent 框架遵循“接收任务 → 规划 → 执行 → 返回结果”的流程，而 Hermes 在这条链路的末端，额外植入了关键步骤：

接收任务 → 规划 → 执行 → 评估 → 提取模式 → 生成技能 → 下次更优

这个自我改进的闭环，让 Agent 每次完成任务后，都会自动将成功的执行过程提炼为可复用的“技能（Skill）”，下次碰到类似任务直接调用，并在使用中持续优化。

大约每处理 15 个任务，Hermes 就会主动回顾一次自身表现，更新技能库。使用时间越长，它在高频任务上的表现就越有可能变得愈发顺手。

跨会话的用户建模

Hermes 另一个重要特征是能够跨会话记住用户，持续记录使用者的偏好、决策习惯和任务模式，逐步构建出个人化的使用画像。

技术架构区别

和 OpenClaw 以 Gateway 中央控制器为核心不同，Hermes 更侧重 Agent 本身的执行循环。网关、调度器、工具运行时、ACP 协议等模块，全都围绕这个循环来组织。

它基于 Python 构建，原生支持函数调用，模型直接输出结构化数据，无需额外解析层，执行路径也更为直接。

模型支持

Hermes 支持 Kimi、MiniMax、GLM 等国内大模型，以及 OpenAI 等国外模型。如果你希望完全本地部署，也可以通过 Ollama 调用 Qwen、Llama 等模型。

消息渠道

支持的渠道包括 CLI 命令行、国内主流应用（微信、企业微信、飞书、钉钉），以及 Telegram、Discord、Slack、WhatsApp 等海外平台。而且它强调跨渠道的对话连续性——你在一个平台上安排的任务，可以切换到另一个平台接着处理。

第二部分：Hermes 与 OpenClaw 架构对比

Hermes 强调“智能分层 + 自动提炼”的自我进化记忆，像大脑一样主动学习、压缩、建立用户模型；OpenClaw 则采用“透明 Markdown 文件 + 人工可控”的显式记忆。在持久记忆、安全性和自主进化能力上，Hermes 的优势更明显。

维度	OpenClaw	Hermes Agent
核心架构	Gateway 中央控制器（Node.js）	以 Agent 执行循环为中心（Python）
技能机制	静态文件，可由用户安装或编写	自主生成，持续自我优化
记忆方式	Markdown 文件，灵活且可编辑查看	有 token 上限，主动精简，避免膨胀
模型支持	主流模型（Claude、GPT、Gemini 等）	200+ 模型，本地部署友好

OpenClaw 在每次对话结束后，由 Agent 自行判断哪些内容重要，并将其追加到本地的 Markdown 文件里。SQLite 则负责全文搜索，帮助 Agent 在下一次会话中找到相关上下文。整套体系对用户完全透明，你可以像管理普通文档一样，直接打开、查看、编辑或删除这些记忆文件。

不过，这种机制的关键特点是无上限、不主动筛选。内容只会不断累积，Agent 自身不会剔除过时或无用的信息。长此以往，记忆文件会越变越大，若不定期手动清理，不仅占用空间，也会逐渐拖累检索质量。

Hermes 的记忆系统则是一套包含四层分层与自动提炼的主动管理机制，其核心目标是让 Agent 越用越懂你、越用越省 token。它主要由以下几个部分构成：

持久笔记层（MEMORY.md + USER.md）：形式上类似 OpenClaw 的文件，但 Agent 会在每次任务结束后自己评估、提取关键模式，并把精华内容主动写入，用户无需手工打理。
会话历史搜索层：所有对话都存入 SQLite 数据库，支持 FTS5 全文搜索；过往对话会被大模型自动汇总压缩，只在需要时注入相关片段，从而避免上下文爆炸式增长。
程序性记忆层（技能库）：这是 Hermes 最独特的地方。任务成功后，它会自动把“如何执行”的流程提炼为可复用的技能模板并存储下来，以后可以直接调用。
用户模型层：这是一个可选的 Memory Provider 插件（Honcho），默认不开启。开启后，会在这三层记忆之上叠加“辩证推理”，持续构建关于“你是谁”的深层模型（包括偏好、决策习惯、沟通风格等）。它支持自动压缩与周期性自我评估，每隔一段时间主动“助推”优化记忆。

此外，还有一种 Nudge 机制将这四个层级串联起来：大约每完成 15 个任务，Agent 就会主动审视自身表现，检查哪些技能需要更新，哪些旧知识应该淘汰。这种定期的“自我整理”有效避免了系统的僵化。

OpenClaw 更强调生态与协同，适合需要多 Agent、强执行力、强路由的场景。
Hermes 则更侧重记忆与成长，适合希望 Agent 持续理解你、适应你、贴近你工作方式的场景。

第三部分：手把手安装 Hermes Agent

操作系统：支持 Linux、macOS、WSL2；原生 Windows 暂不支持，需要先安装 WSL2。
唯一前置依赖：确认已安装 git。

其余依赖均由安装脚本自动处理，包括：

uv（快速 Python 包管理器）
Python 3.11（通过 uv 安装，无需 sudo）
Node.js v22（用于浏览器自动化和 WhatsApp 桥接）
ripgrep（快速文件搜索）
ffmpeg（TTS 音频格式转换）

如果你已经安装了 OpenClaw（龙虾），可以完全交给它来代为安装 Hermes。

一键安装

Linux / macOS / WSL2 / Android Termux 下执行：

curl -fsSL https://raw.githubusercontent.com/NousResearch/hermes-agent/main/scripts/install.sh | bash

安装完成后：

source ~/.bashrc         # 或 source ~/.zshrc
hermes                    # 直接启动聊天

配置模型与初始化

安装完毕，可直接运行配置向导：

hermes setup         # 一键配置所有选项（推荐初次使用）
# 或分步配置：
hermes model         # 选择 LLM 提供商和模型
hermes tools         # 配置启用哪些工具
hermes gateway setup # 配置消息平台（微信、飞书等）

hermes model 支持的提供商包括：OpenRouter（200+ 模型）、Nous Portal（400+ 模型）、OpenAI、Google AI Studio、xAI（Grok）、Kimi、MiniMax，以及通过 Ollama 运行的本地模型。

验证安装

hermes version     # 确认命令可用
hermes doctor      # 诊断检查，验证所有依赖是否正常
hermes status      # 查看当前配置
hermes chat -q "Hello! What tools do you have available?"  # 快速测试

微信连接步骤

Hermes Agent（v0.8.0 及更高版本）原生支持连接个人微信，利用腾讯 iLink Bot API。它支持私聊与群聊，可收发图片、视频、文件、语音等全媒体消息，并会自动将 Markdown 转换为微信友好格式。

在设置向导中选择 Weixin 或 WeChat 后，系统会生成二维码，扫码登录即可。成功后，相关凭证会保存在本地目录中。

在终端执行（确保 Hermes 已安装）：

pip install aiohttp cryptography
# 可选：在终端直接显示二维码（推荐）
pip install qrcode

运行设置向导（推荐，一键完成）：
```
hermes gateway setup
```
- 用上下箭头选中 Weixin（或 WeChat），按空格确认。
- 向导会自动从 iLink Bot API 请求二维码。
- 终端会出现二维码（或链接），用手机微信扫码 → 确认登录。
- 成功后提示：微信连接成功，account_id=xxxxxxxx
所有凭证自动保存到 ~/.hermes/weixin/accounts/ 文件夹。
配置环境变量（向导已处理大部分，只需检查）
打开或创建文件：
```
nano ~/.hermes/.env
```
至少确保包含以下内容（向导已自动填入 account_id）：
```
WEIXIN_ACCOUNT_ID=你的account_id   # 必填
```
启动网关（后台常驻）
```
hermes gateway
```
看到类似 “Weixin adapter connected, long-polling started” 即代表成功。

直接在微信里私聊或 @机器人发消息，它便会响应、执行任务并生成技能。
支持语音转文字（可选）、图片/文件上传下载等。
跨平台连续性：在微信里开始的任务，可在 Telegram/Discord 继续，记忆完全同步。

注意事项与常见问题

群聊默认关闭：要启用群聊，需手动设置 WEIXIN_GROUP_POLICY=open 或添加白名单。
只能运行一个实例：同一个微信账号仅能启动一个 Hermes 网关。
二维码过期：扫码失败时，重新执行 hermes gateway setup。
依赖缺失：若提示 “aiohttp/cryptography not found”，重新运行 pip install。

第四部分：如何选择：Hermes 还是 OpenClaw？

Hermes Agent：以单 Agent 不断进化为核心，强调“越用越聪明”。
OpenClaw：以多 Agent 协同为核心，侧重“工具协作与生态扩展”。

若在两个之间犹豫，可以直接从使用目标出发。

优先考虑 OpenClaw，如果你：

对工具执行力要求很高：依赖大量社区现成技能，需要浏览器、Shell、邮件、日历等复杂操作，追求即插即用的执行能力。
所有操作必须显式授权、可审计、透明（技能就是 Markdown 文件，一目了然）。
需要多 Agent 协作：多个不同 Agent 互相配合、复杂路由、跨平台自动化。

优先考虑 Hermes Agent，如果你：

任务需要“记忆与成长”，例如长期项目管理、个人知识库搭建、自动化工作流优化。需要跨会话记忆、用户画像建模、个性化（比如记住你的写作风格或项目上下文）。
在意数据隐私，更倾向于完全本地化运行。
喜欢尝试不同模型，希望在成本和效果之间灵活切换。

两者也可以双修：

如果你长期深度使用 Agent，一种很实用的组合方式是：

OpenClaw 负责广度：消息路由、自动化执行、跨平台操作。
Hermes 负责深度：记忆积累、技能沉淀、长期学习。

第五部分：总结与思考

OpenClaw 已经证明，自主 AI Agent 完全可以承担自动化工作流与 7×24 小时跨平台运行，它定义了这个方向的基本边界。

而 Hermes 则在追问另一个问题：如果 Agent 本身足够强大，为何还要依赖外部系统不断修补？它能否把复杂性直接内化进模型自身？这一思路能否经受住时间的检验，还需要更长周期的观察。但对那些日复一日处理相似任务，并真切渴望工具能“越用越顺手”的人而言，Hermes 所代表的方向，值得认真关注。