Claude Code飞书深度集成实战:5个企业级AI代理玩法,解锁协同办公新范式
最近常有人问我:平时用 AI 代理 Agent 时,是怎么和那么多数据打交道的?
其实我的思路一直很清晰,本地数据和云端协同数据走的是两条线。我们公司现在将近30个人,我给团队定的规矩是:只要涉及同事之间协作的内容,一律上云。所以你会发现,很多日常交互都是我在让 Claude Code 直接跟飞书对话,我们的小伙伴们也用得越来越顺手,大家打开图形界面的时间反而在明显减少。
大概一个月前,飞书 CLI 第一次开源那会儿,我分享过一篇实操文章,数据反馈很不错。但仅仅过了一个月,飞书在背后默默追加的能力,到今天我一统计,已经接近120项了。
说实话,这有点吓人。CLI 开放的能力都快赶上 API 了,这种节奏实在少见。

现在,只要你不是那种追求极致定制和变态精细度的极客,用 Claude Code 这类工具去操控飞书,几乎什么都能干。官方已经把能力大全搬到了飞书开放平台,链接在这儿:
https://open.feishu.cn/changelog?abilityType=Tool
GitHub 上,飞书 CLI 的 star 数也快破万了。

所以,我今天就想把我们团队自己用 Agent 跟飞书 CLI 配合的真实案例拿出来聊聊,过程中真的有好多让我忍不住拍桌子的惊艳时刻。
话不多说,直接看场景。
1. 给每个长期会议系列养一个跨场次知识库
第一个特别想展开讲的,是我们已经在稳定使用,并且事后证明极有价值的场景:为每一套周期性会议沉淀一套可复用的知识库。
我们内部每周都有培训会、周会、复盘会,类似这种重复发生的会议一抓一大把。这些会都有一个共同的顽疾——开完之后,飞书妙记安安静静躺在那里,最多会后当天翻一下,长期来看几乎没人做追踪。
时间拉长,问题就暴露了。
有一次在选题会上讨论过一个长线选题,事件本身是假期后才发生的,当时所有人都觉得方向很好,结果假期一结束回到工位,这件事就像从未存在过。
又比如,每次有新人加入,我非常希望他们能快速熟悉我们选题会的流程、选材偏好和标准,而这些真实项目中累积下来的选题会记录,其实正是最好的上手材料。可是没有人整理,没有人沉淀,过去的会议就全浪费了。
拿我们3月份的选题会数据举例,出于隐私保护只展示部分。一旦你有了飞书 CLI,就可以直接在 Claude Code 里调用它进行交互。

没一会儿,它就自动生成了一份飞书文档。会议清单、选题转化分析、会议节奏、决策机制、现象梳理、改进建议……一应俱全。
让 Agent 直接接入飞书取数,再用模型整合出这样一份内容,完全是舒服到骨子里。以前我们得把数据导出来再手动用 Agent 整理,那过程真的繁琐到让人头疼。

它出来的东西极其全面细致,每一场选题会讨论过哪些选题、最终决议是什么、选上和砍掉的理由,全部列得明明白白。

这里面有很多信息都是可以直接沉淀进知识库的经验素材。
重复性会议的经验留存,可以用到各个方向,直接形成固定知识库,方便以后做各种知识存档和管理。
公司内部的培训会也是一样的逻辑,先让 Agent 把过去的培训会抓一轮,沉淀成知识库。以后隔一段时间,让它自动去抓取新的会议信息,自动维护更新,说起来就是打开 Claude Code 一句话的事。
而这些知识库一点点积累下来,我相信对任何一家公司都是极其宝贵的无形资产。

2. Agent + 飞书实现个人工作的全维度复盘
第二个用法是同事特别喜欢的:给自己做一次真正全面的工作复盘。
Claude Code更新导致启动失败?三步解决Windows平台不兼容问题
今天早上到公司,先摸了一个小时的鱼。摸完之后,准备老老实实打开 Claude Code 干活,结果——启动失败了。如下图:

程序“claude.exe"无法运行:指定的可执行文件不是此操作系统平台的有效应用程序。

然后我打开CMD一顿操作,下载重装,还是报错:
该版本的claude.exe 与你运行的 Windows 版本不兼容。请查看计算机的系统信息,然后联系软件发布者

我擦,这提示看着太像系统级故障了,我一度怀疑是不是装错了什么东西。

紧接着,我第一反应是:别慌,先打开 Codex 让它帮我看一下。结果真被它一把梭解决好了。

我试了下,确实不报错了。然后关掉 Codex,打开第二个命令窗口启动 Claude 时,我擦,怎么又报同样的错?又是那个标红提示。
| Image | Image |
还是那句报错。这下我彻底懵了。
接下来一上午,我都在跟这个问题死磕。一开始我怀疑的是 Node 版本。
因为我平时用 nvm 管理 Node,所以很自然地往版本切换上想。中间来回试了好几个版本,电脑重启了多次,折腾得差点以为要重装系统,结果都不行。

讲真,搞到后面我甚至开始怀疑,是不是电脑里的安装包彻底损坏了。
后来继续查,在 X 上刷到一个帖子,终于解决了!
最近很多人都遇到这个问题!
根本原因是: Claude Code 会自动检测更新,而前两天 Anthropic 把 Claude Code CLI 的安装方式改了,自动升级后 Claude Code 会变得不兼容!必须重新卸载重装。
也就是说,你本地如果还是旧的 npm 安装版本,自动更新之后,整个结构就可能直接不兼容。然后 Windows 识别 claude.exe 的时候,就会给出这种很唬人的提示,看着像系统不支持,实际上只是安装方式断层了。

不是你的系统太老,也不是电脑突然加载了什么插件不行了。处理思路很简单:直接把旧版本卸掉,然后重装最新版。
保姆级教程
第一步,卸载旧版本:
npm uninstall -g @anthropic-ai/claude-code
第二步,如果你安装很慢,或者干脆装不上,可以顺手切一下 npm 镜像:
Claude开源科研助手实战:130+科研技能即刻部署,让AI化身全能研究伙伴
项目地址:https://github.com/K-Dense-AI/claude-scientific-skills

Claude Scientific Skills 是一套全面开源、包含 130 多项即用型科研与学术技能 的集合,可将任何 AI 编程助手升级为高效的研究搭档。这些技能基于 K-Dense 公司制定的开放 Agent Skills 标准构建,为你的 AI Agent 配备精心编排的文档、代码示例和最佳实践,使其轻松驾驭基因组学、药物研发、临床研究、量子计算等多领域的专业科学库、数据库与工具。可以把它理解为一个预加载的知识库,让你的 AI Agent 能以“资深研究员视角”运用科学软件,省去你耗费数天研读 API 文档的时间。

Claude Scientific Skills 代码库正在高速增长。截至 2026 年 3 月下旬,该项目已斩获 16.4k star 和 1.8k fork,是科学计算领域获星最多的 agent 技能代码库之一。
项目意义
每项技能对应 scientific-skills/ 目录下的一个独立文件夹,旨在教会你的 AI Agent 如何操纵特定工具或数据源。技能本身不是工具,而是一套经过优化的指令、文档和代码示例,当向 Agent 指派相关任务时,它会自动查阅这些内容。底层所需的 Python 包和 API 须单独安装;技能的唯一职责是确保 Agent 能正确且高效地使用它们。
这 130 多项技能可归纳为五大核心类别,分别对应科学计算栈的不同层面:
| 类别 | 技能数量 | 涵盖内容 | 示例 |
|---|---|---|---|
| 科学数据库 | 37+ 专项技能 → 覆盖 250+ 个数据库 | 针对特定命名数据库的直接优化访问,用于查询基因组学、化学、临床及文献数据 | PubMed、ChEMBL、UniProt、COSMIC、ClinicalTrials.gov、Ensembl |
| Python 包技能 | 60+ 优化包 | 针对主流科学计算 Python 库精选的文档与最佳实践 | RDKit、Scanpy、PyTorch Lightning、scikit-learn、PennyLane、Qiskit |
| 科学平台集成 | 15+ 个平台 | 面向实验室与云平台的编程访问,实现自动化与数据管理 | Benchling、DNAnexus、Opentrons、LatchBio、OMERO |
| 分析与学术交流 | 35+ 个工具 | 文献综述、写作、可视化、文档处理及演示工具 | Scientific Writing、Peer Review、Scientific Slides、LaTeX Posters |
| 研究与临床工具 | 10+ 个专用工具 | 假设生成、临床决策支持、基金申请、法规合规 | Clinical Decision Support、Treatment Plans、Research Grants |
功能特性
Claude Scientific Skills 的强大之处在于可以单条提示中组合多项技能,从而搭建出通常需要跨多个工具专家知识才能完成的复杂多步科研工作流。以下仅列举其覆盖的若干领域:
Data Vault 2.0 深度解析:敏捷数仓建模的利与弊
Data Vault 2.0 不单是一种建模手段,更是一整套数据仓库建设的方法体系,它能够可靠地实现对历史轨迹追溯与审计核查两大核心诉求的支撑。
过去多年里,商业智能(BI)项目长期依赖瀑布式开发生命周期。其特征表现为各个阶段依次展开、周期漫长,通常需要详细的前期需求列表、完整的数据模型设计,再把所有硬业务规则与软业务规则植入 ETL 流程。可视化层同样是串行构建,从项目启动算起,数月甚至数年之后才能交付给最终用户。

我们常见团队采用“缩小范围”的瀑布变体,试图把大型 BI 计划切割成规模更小的子项目。虽然这种做法有助于降低整体复杂性,但当它应用于 BI 领域时依然暗藏巨大风险,原因主要有两个:
- 业务需求变化的速度远超 BI 团队能够交付的节奏;
- 预算方往往不愿为缺少短期回报的长期工程买单。
正是这两点促使我们从瀑布模式转向可迭代的敏捷模式,而敏捷确实为应对上述问题提供了思路。不过,在数据分析这个具体领域,仅仅采纳敏捷本身并不能解决数据仓库或 BI 项目在更细粒度上遇到的严峻挑战,例如:
- 如何进行迭代式数据建模;
- 如何减少重构成本;
- 如何设计 ETL/ELT 流程,使其能够快速响应业务逻辑的调整或新增数据的接入;
- 如何围绕设计决策来采集与输入数据相关的业务需求。
为了解决这些难点,Data Vault 2.0 应运而生。它定义了一整套方法,专注于从敏捷实践中挖掘最大价值,并融合了其他已经被验证有效的规范和技术,堪称目前迭代性最强的 BI 方法论。
什么是 Data Vault
Data Vault(DV)将敏捷理念、BEAM 需求采集、CMMI、TQM、六西格玛以及 DV 建模等要素熔于一炉,目的是构筑一种能够同时提升 BI 项目交付速度与质量的方法,因为它既能增强灵活性,又能提高准确性。
DV 还包含了针对数据仓库项目评估和敏捷任务分级的敏捷化手段,用来准确判断任务复杂度或横跨数据仓库的工作量。在更微观的层面,它还提供了一套非常精炼且迭代性强的方式来处理常见的功能性需求。这些涵盖了全面、可重复、渐进式且以敏捷为基石的流程,用以完成日常任务,例如(但不限于)在 ETL 和建模阶段添加数据属性、进行数据切片、新增数据源、扩展源系统、历史轨迹追踪、弃用旧源以及响应源端结构变化等。
简单来说,DV 模型是传统维度建模(OLAP、星型模式)与暂存区之间的一个独立层,它能依据不断增长的业务需求进行灵活伸缩,并化解建模与 ETL 的复杂性。DV 模型由中心(业务实体)、链接(关系)和卫星(描述属性)三类构件组成,其建模范式介于 3NF 与星型模式之间。该层放置在数据集成层(常称为原始数据库或 Raw Data Vault),并能与 Kimball 的维度模型高效协同。

Data Vault 2.0 的优势
以下是 Data Vault 2.0 方法论带来的一些主要收益:
它假定数据建模中的关系存在最坏情形——即业务对象之间普遍为 M:N 关系,以此避免当关系从 1:M 演变为 M:M 时需要进行结构变更。这样一来,关系粒度发生变化时几乎无需额外返工。
DeepAgents:一站式复杂AI任务智能体框架,规划、沙盒与子代理开箱即用
Deep Agents 是一套基于 LangChain 和 LangGraph 的智能体基础套件,内建规划、文件系统交互以及子代理动态生成能力,专为应对高复杂度智能体任务而设计。
Deep Agents 提供开箱即用的 Agent 框架,用于搭建能够自主规划、对复杂任务进行推理、管理文件、执行 Shell 命令并将工作委派给专用子代理的 AI 代理——这一切都无需额外拼装提示词、工具和上下文管理逻辑。你拿到手的是一个立即可运行的智能体,同时保留了充分的定制空间。
破解 AI 代理的“浅层”困境
最简形式的 AI 代理仅仅是在循环中让大语言模型调用工具。然而这种架构往往流于表面,难以胜任跨多个回合、步骤繁多的复杂任务。像 Claude Code、Deep Research 和 Manus 这类应用通过融合四个关键要素突破了这一瓶颈:规划工具、子代理、对文件系统的访问以及详尽的系统提示词。Deep Agents 将这四种模式封装为一个可复用的 Python SDK,让你不仅能构建交互式终端,还能为自有应用打造具备深层能力的智能体。
其核心思想是:深度源自架构,而不仅仅来自模型。配备合理的中间件、工具抽象和上下文管理机制的智能体框架,能将能力强大 LLM 变成一套真正可靠的自主系统。
整体架构一览
Deep Agents 以 Python monorepo 的形式组织,包含多个独立版本控制的包。处于核心的是核心 SDK(deepagents),它提供 create_deep_agent() 工厂函数、中间件系统以及可插拔的后端抽象层。围绕核心 SDK 的是 CLI、编辑器集成、评估套件和沙盒合作伙伴等配套包。

六大内核能力:开箱即用的可组合工具
Deep Agents 附带六大内置能力类别,每一类均以可组合的中间件或后端组件形式实现:
| 能力 | 提供的工具 | 中间件 / 后端 |
|---|---|---|
| 规划 | 用于任务拆分与进度追踪的 write_todos | TodoListMiddleware |
| 文件系统 | read_file、write_file、edit_file、ls、glob、grep | FilesystemMiddleware + BackendProtocol |
| Shell 访问 | 执行命令(沙盒化)的 execute | SandboxBackendProtocol |
| 子代理 | 在隔离上下文中委派任务的 task | SubAgentMiddleware |
| 上下文管理 | 对话变长时的自动摘要 | SummarizationMiddleware |
| 记忆与技能 | 通过 AGENTS.md 持久化记忆,自定义斜杠命令 | MemoryMiddleware、SkillsMiddleware |
系统会自动包含一个名为 general-purpose 的通用子代理,无需额外配置即可提供内置任务委派能力。
DeepSeek TUI 完全指南:从零开始掌握终端原生 Agent 的安装与配置
DeepSeek TUI 是一款由 Rust 打造的终端原生编码代理(Agent),它能直连 DeepSeek V4 模型,为你提供键盘驱动、流式响应的交互界面,可轻松完成文件读取、代码编辑、Shell 命令执行、网络搜索、Git 管理以及子代理编排——全部操作仅需一个 deepseek 命令。该项目包含两个协作的二进制文件:deepseek 调度器 CLI 和 deepseek-tui 伴生运行时,二者共同组成一个流式 Agent 循环,底层由兼容 OpenAI 的聊天补全客户端、类型化工具注册表、会话检查点和基于 ratatui 的终端界面支撑。整个项目以 Cargo workspace 形式组织,包含 14 个 crate,目标平台涵盖 Linux (x64/ARM64)、macOS (x64/ARM64) 和 Windows (x64),并支持通过 npm、Cargo、Homebrew、Scoop、Docker 及直接下载 GitHub Release 二进制文件等多种渠道分发。
项目链接:https://github.com/Hmbown/DeepSeek-TUI

deepseek-tui
核心亮点

Deepseek整体概览
DeepSeek TUI 远非 API 的简单包装——它是一套完整的 Agent 运行时,负责对话轮次管理、推理块实时流式传输、通过可配置的审批关卡执行工具,并在重启后保持会话状态。三种工作模式(Plan、Agent、YOLO)让你能够从只读探索、带审批的交互式工具使用到完全自主执行之间自由切换。内置的 Auto 模式(--model auto)为每轮交互添加了一个轻量级路由步骤:它会调用一次小型 deepseek-v4-flash 模型,决定实际请求应在 Flash 还是 Pro 上执行,以及应采用何种推理深度,从而避免在简单查询上浪费算力。每个工具的执行结果都会回流到 Agent 循环,编辑后还会注入 LSP 诊断信息,同时成本跟踪会报告每轮交互的缓存命中详情。
| 功能 | 描述 |
|---|---|
| Auto 模式 | 通过 Flash 路由器为每轮对话自动选择模型和推理深度 |
| 思考模式流式传输 | 在模型运行时实时查看 DeepSeek 推理片段 |
| 三种模式 | Plan(只读探索)、Agent(含审批关卡)、YOLO(自动审批) |
| 1M token 上下文 | 上下文跟踪、压缩与前缀缓存遥测 |
| 完整工具套件 | 文件操作、shell、git、网络搜索、apply-patch、子 Agent、MCP 协议 |
| 会话保存/恢复 | 支持检查点和长时间运行会话的恢复 |
| 工作区回滚 | 基于 git 快照的 /restore 和 revert_turn 功能 |
| 持久化任务队列 | 后台任务在重启后仍可存活 |
| HTTP/SSE 运行时 API | 通过 deepseek serve –http 实现无头 Agent 工作流 |
| MCP 协议 | 连接外部模型上下文协议工具服务器 |
| LSP 诊断 | 每次编辑后由 rust-analyzer、pyright 等提供内联错误 |
| 本地化 UI | 支持英语、日语、简体中文、巴西葡萄牙语 |
| 技能系统 | 可从 GitHub 安装的可组合指令包 |
| 多提供商 | 支持 DeepSeek、NVIDIA NIM、OpenAI、Fireworks、SGLang、vLLM、Ollama |
系统架构解析
系统采用分层架构,并界定了严格的数据流边界:TUI 层负责界面渲染和输入捕获;核心引擎层驱动 Agent 循环并处理工具调用;工具与扩展层执行具体操作;LLM 客户端层负责与模型的流式通信。层与层之间通过类型化的通道和事件进行交互——UI 层不会直接调用工具,引擎层也不会直接向屏幕输出。
DeepSeek 首轮融资 450 亿美元:国家队领投,国产 AI 芯片生态迎来决定性转折
彭博社 2026 年 5 月 6 日披露,DeepSeek 正在推进其历史上第一轮外部融资,公司估值高达 450 亿美元(约合 3065 亿元人民币),牵头方正是国家集成电路产业投资基金(大基金三期)。这不仅是 DeepSeek 首次对外吸收资本,也是国家级资金首次直接注资一家中国大模型企业。
一个月内,估值膨胀 4.5 倍
DeepSeek 的估值轨迹足以成为融资教科书中的经典案例:
| 时间节点 | 估值水平 | 关键事件 | 信源 |
|---|---|---|---|
| 2026 年 4 月 17 日 | ~100 亿美元 | 融资传闻首次浮出水面 | The Information |
| 2026 年 4 月 22 日 | ~200 亿美元 | 腾讯、阿里传出入股意向 | 多家媒体 |
| 2026 年 5 月 6 日 | 450 亿美元 | 大基金三期领投确证 | 彭博社 |
短短一个月,市值/估值直接翻了 4.5 倍。

背后的原因只有一个:市场猛然意识到——
DeepSeek 不只是一家人工智能企业,它已经是中国 AI 产业链条中最核心的连接点。
这轮融资为何值得每个人关注?
你可能会问:“一家公司的融资消息,和我有什么关系?”
实际上,牵一发而动全身。
对开发者而言:DeepSeek 的模型(V3、V4、R1)正逐步演变为国产大模型的事实标准,其 API 定价策略直接决定着你的计算成本。
对投资者而言:450 亿美元的估值意味着 DeepSeek 已超越 MiniMax(港股上市,市值约 298 亿美元),直逼智谱 AI(港股上市,市值约 523 亿美元),稳居中国 AI 公司估值第二的位置。
DeepSeek-TUI:终结Claude Code封号噩梦,用开源与低成本重塑终端智能体
半夜,我那台发烫的拯救者上,Claude Code 正在重构一个 Web 项目。
终端忽然弹出一行刺眼的红字:
This organization has been disabled.
封号。
没错,又一次。这已经是我第三个被干掉的 Claude 账号了。静态独享 IP、海外手机号、环境隔离,所有能做的防御全部拉满,该来的还是来了。

不得不承认,Claude Code 的体验很惊艳。它几乎把“终端就是 Coding Agent 最自然的入口”这件事说透了。但对国内用户而言,它带来了另一种长久折磨:昂贵、难接入、风控严苛。你付了钱,还得时刻提心吊胆。
我本想找朋友吐槽,顺手在 X 上翻了翻。结果看到一个刚更新的开源项目,而且相当离谱。
一位美国开发者,做出了一个专为 DeepSeek 打造的终端 Coding Agent。
DeepSeek-TUI。

真正让我停下来的,不是它发明了什么新范式。Claude Code 已经跑通了终端 Agent 的这条路。DeepSeek-TUI 的有趣之处在于:它把 Claude Code 所代表的那种体验,从封闭产品中重新拆解回开源项目里。
模型接口是 DeepSeek。界面是 TUI。也就是说——一个 DeepSeek 版的 Claude Code。工具调用、权限控制、上下文管理、Skill、MCP、子 Agent,全部摆在明面上。你不再需要等一个海外 SaaS 为你开门,而是在自己的机器上,把 Claude Code 验证过的工作流,用 DeepSeek 重新拼装起来。
所以我不想叫它“国产平替”。“平替”这个词太小了。它更像一次仔细的拆解和重组。
更有意思的是,项目作者是一位美国开发者。GitHub 账号 Hmbown,本名 Hunter Bown。一个美国人,做了一个面向 DeepSeek 的终端 Coding Agent,然后用 DeepSeek 把自己的话润色成中文,跑到中文技术圈里招呼“鲸鱼兄弟们”。
你品。一个美国开发者,用中国大模型写中文,来中国开源圈推广一个 DeepSeek Agent。这个传播链路弯绕得像一碗兰州拉面,但它居然有效。
DeerFlow 2.0深度解析:字节跳动开源的超级Agent框架如何实现复杂多步任务编排
项目地址:https://github.com/bytedance/deer-flow

DeerFlow 2.0 是由字节跳动火山引擎团队倾力打造的开源 超级 Agent 框架。它基于可扩展、渐进式加载的技能体系,能够高效编排子 Agent、内存和沙箱,从而完成复杂的多步任务。框架全称 Deep Exploration and Efficient Research Flow,意为深度探索与高效研究流,折射出其深耕深度研究领域的起源,如今已演变为一个通用 Agent 运行时,不仅能构建数据处理流水线,还支持幻灯片生成、仪表盘启动、内容工作流自动化等丰富场景。

2026 年 2 月 28 日,DeerFlow 2.0 正式发布,一经推出便迅速登上 GitHub Trending 榜首。该版本完全从头重写,与 v1 没有任何代码复用,全新的架构为其带来了更强的灵活性和性能。

核心特性与功能
DeerFlow 与传统聊天机器人框架的分野在于,它为 Agent 提供了一个完整的 执行环境——不仅仅是简单的工具访问权限,更涵盖了完整的沙箱文件系统、并行子 Agent、持久化记忆,以及通过渐进式加载保持上下文窗口精简的技能引擎。
技能与工具
技能被组织成结构化的 Markdown 文件,其中定义了工作流、最佳实践和资源引用。这些技能 仅在需要时加载,即便是使用对 Token 用量敏感的模型,也能保障上下文窗口始终高效运转。DeerFlow 内置了 17 项技能,覆盖深度研究、数据分析、图表可视化、PPT/播客/视频生成、前端设计等诸多领域。工具遵循同样的设计理念:提供一套核心内置工具集(包括网页搜索、网页抓取、文件操作、Bash 执行),并通过 MCP 服务器和自定义 Python 函数进行灵活扩展。
子 Agent
主导 Agent 能够动态生成 并行子 Agent——每个子 Agent 都拥有隔离的上下文、专用工具和独立的终止条件。一项研究任务可以拆解成十几个从不同视角探索的子 Agent,最终汇聚成报告、网站或幻灯片。这种任务分解机制让 DeerFlow 具备处理耗时数分钟乃至数小时长链路任务的能力。
沙箱执行
每一个任务都在具备完整文件系统的 隔离 Docker 容器 中运行,其内部包含技能、工作区、上传和输出目录。Agent 可以读取、写入、编辑文件,执行 Bash 命令,查看图像——所有这些操作均在沙箱中完成,完全可审计,且会话之间零污染。系统支持三种执行模式:本地执行(适用于开发环境)、Docker 容器(推荐方案)以及通过配置器启动的 Kubernetes Pod(高级用法)。
Hermes Agent:开源闭环进化智能体,跨平台自我改进引擎

Hermes Agent 是 Nous Research 打造的一款持续自我进化的 AI 智能体。它通过闭环学习机制区别于其他智能体框架——该智能体能够从经验中提炼技能,在使用过程中不断改进这些技能,检索自身的历史对话,并逐步构建关于用户的深度模型。不论你是在终端中直接对话、通过 Telegram 发消息,还是集成到 IDE 中使用,Hermes 在所有交互入口都运行着同一个核心智能体引擎。
项目链接:https://github.com/nousresearch/hermes-agent
Hermes 的独特优势
绝大多数 AI 智能体都只是无状态的“请求-响应”流水线——每一次对话都从零开始。而 Hermes 从设计之初就定位为有状态且能自我改进的系统。它会记住已经完成的操作,将这些知识组织成可以复用的技能,并在每次交互中利用这些技能不断提升表现。

下表将 Hermes 与常见的智能体框架进行了直观对比:
| 能力 | 典型智能体框架 | Hermes Agent |
|---|---|---|
| 记忆持久化 | 仅限单次会话 | 跨会话 FTS5 搜索、Honcho 对话分析、持久化记忆提供者 |
| 技能创建 | 需要手动设计提示词 | 智能体在完成复杂任务后自动生成技能,并在使用中自行优化 |
| 模型灵活性 | 绑定单一供应商 | 在对话中通过 /model 随时切换供应商——OpenRouter、OpenAI、Anthropic、Gemini、Nous Portal、本地模型 |
| 消息平台 | CLI 或单一平台 | 单一的网关进程同时接入 16+ 个平台(Telegram、Discord、Slack、WhatsApp、Signal、Matrix 等) |
| 终端后端 | 仅限本地 Shell | 本地、Docker、SSH、Daytona、Singularity、Modal——包括无服务器休眠 |
| 定时自动化 | 依赖外部 cron 或缺失 | 内置 cron 调度器,支持自然语言定义任务,并可跨平台投递 |
| 子智能体委派 | 极少支持 | 用于并行工作流的隔离子智能体,通过 RPC 脚本实现零上下文成本轮次 |
| IDE 集成 | 不支持或需付费 | 基于 ACP(Agent Client Protocol)适配器,可接入 VS Code、JetBrains 及任何兼容 ACP 的客户端 |
| 研究工具 | 重点关注不足 | 批量轨迹生成、Atropos RL 环境、用于训练的轨迹压缩 |
整体架构设计
Hermes 围绕同一个智能体引擎构建,并通过多种前端界面提供服务。无论是 CLI(cli.py)还是消息网关(gateway/run.py),都会将数据送入 run_agent.py 内统一的对话循环,由该循环负责编排 LLM 调用、工具执行、记忆检索以及技能管理。此外,ACP 适配器(acp_adapter/server.py)作为第三种前端,利用标准化的 Agent Client Protocol 实现 IDE 集成。