腾讯开源AgentMemory：四层记忆架构让AI记住你，准确率提升60%

June 20, 2026

腾讯开源AgentMemory，让AI真正记住你

腾讯最近开源了一个项目，短短两个月就收获了4600多个Star。它的目标非常专一：为AI Agent装配长期和短期记忆能力。

那装上之后效果如何？我们看评测数据：长期记忆的整体准确率从47.85%提升到76.10%，涨幅接近60%；用户事实召回率从不到30%飙升至79%；而在短期记忆的加持下，长任务最高能节省61%的token消耗。

这个项目就是TencentDB Agent Memory，由腾讯云数据库团队于5月14日正式开源。

AI 记忆到底难在哪

当下，每当你开启一个Agent的新会话，系统几乎默认它对过往一无所知。你不得不重新描述背景或上下文，它才可能按预期工作。而记忆的终极目的，正是提升效率。

TencentDB Agent Memory的思路与主流方案迥然不同，它采取的是符号化短期记忆 + 分层长期记忆。

目前主流的解决方案大致有三种，但均存在明显短板。

第一种，全量塞进上下文窗口。简单粗暴，可窗口有硬上限，塞得太多token直接爆掉。

第二种，用向量数据库做记忆。比全塞上下文要好一些，但致命伤在于只存不提炼。当对话碎片繁多时，召回率低，精确度也不够。

第三种，让大模型自己做摘要压缩。但压缩是不可逆的，常常导致关键细节丢失。

腾讯开源项目的核心架构

这个项目最核心的设计，是一套四层渐进式记忆架构。从L0到L3，从底到顶，每一层各司其职。

TencentDB Agent Memory L0 to L3 semantic pyramid

L0：原始对话。
全量保留，一字不落，作为兜底，随时可供回查。

L1：原子事实。
系统会自动从对话中提取独立的事实节点，例如“我爱吃火锅”、“我后面用NextJS”，打上标签并存储。

L2：场景聚类。
相关的原子事实按场景汇聚。比如，用户在系统讨论中涉及的所有事实——表结构、权限、接口——会合成一个场景块，以Markdown格式呈现，人可以直接阅读。

L3：用户画像。
基于下面三层生成稳定的用户画像，沉淀技术偏好、代码风格、常用工具链等。

Retrievable and Recoverable Drill-Down Chain

这样一来，既不会因为上下文过长影响推理，也不会丢失关键信息。而且，系统保证了从顶层到原始证据的完整回溯路径。比如L3里提到用户偏好TypeScript，这个结论可追溯到L2的某个场景块，场景块里的每条结论又能回溯到L1的原子事实，而原子事实最终指向L0中你曾经说过的那句话。整条证据链稳固不断裂。

短期记忆压缩：巧用 Mermaid 图

四层架构解决的是长期记忆，但短期上下文同样是烧钱大户。比如AI排查一个bug需要调用十几次工具，上下文会被日志塞满。

解法是符号化记忆，也就是把完整的日志卸载到外部文件，再用Mermaid语法绘制一张紧凑的任务状态图塞进上下文。需要细节时，则通过节点ID来检索。Mermaid用极少的token，将线性摘要列表重组为带状态、依赖关系和可寻址索引的任务拓扑结构图，让大模型通过图的拓扑来推断任务全貌，而不必死记某个标签。

这种方式信息密度更高、结构不丢失、细节可逐层找回。实测结果显示，Token消耗直降超50%，任务完成率反而提升了23%。既省了钱，活儿还干得更好。

语义检索（Embedding）擅长模糊匹配，关键词检索（BM25）则长于精确命中。两路各自召回候选结果，再经由RRF融合排序，语义相关的不会遗漏，精确匹配的也不会丢失。

跑出来的数据

说了这么多设计，来看看实际跑出来的数据。腾讯使用PersonaMem基准测试做了评测，对比了原生OpenClaw与接入Agent Memory之后的OpenClaw：

指标	原生 OpenClaw	接入 Agent Memory
总准确率	47.85%	76.10%（+59%）
用户事实召回	29.63%	79.07%（+167%）
偏好跟踪	66.67%	83.45%（+25%）
个性化推荐	46.67%	76.36%（+64%）

其中用户事实召回这个指标最为夸张，从不到30%飙升到79%。也就是说，从前你跟AI说过十件事，它只能想起三件；现在，它能想起八件。

除了PersonaMem，项目还跑了几个编程相关的基准测试：

WideSearch成功率从33%提升至50%，token消耗削减61%；SWE-bench通过率从58.4%升至64.2%，token节省了33%。

加了记忆不但记得更多，做任务的效率也明显变高，省下的token都实实在在地用在了正事上。

怎么用

该项目目前作为OpenClaw的插件发布，安装非常简单，只需一行命令：

openclaw plugins install @tencentdb-agent-memory/memory-tencentdb

装完之后默认使用本地SQLite + sqlite-vec作为存储后端，零配置，开箱即用。无需单独安装数据库，也不用连接外部服务，数据完全存放在本地。如果想接入外部Embedding服务来增强语义检索效果，也只需在配置文件里指定即可。

如果你使用的是Hermes Agent框架，项目还提供了Docker一体化镜像，把Hermes + Agent Memory插件 + Gateway全打包在一个容器里，docker pull下来就能直接跑。

支持的模型也非常灵活。最新的1.0.0-beta.1版本为希望自主开发Agent Memory适配层的用户提供了快速开始的方法。

腾讯云数据库AI能力版图

TencentDB Agent Memory并非腾讯云凭空诞生的独立项目，而是5月29日腾讯云“数据库+AI”发布会的一部分。

这场发布会的主题为 AI 原生·重构数据库新范式，核心思路是：当Agent成为新的生产力单元，数据库的使命就要从“存储数据”演进为支撑智能体感知、记忆、决策与协作的数据底座。

沿着AI原生数据库这条主线，腾讯云此次一口气发布了多款产品：

DatabaseClaw，腾讯云第一个数据库Agent。它不同于普通的AI DBA助手，不仅能回答问题，更能够真正进入生产环境承担运维职责，7x24小时不间断运行。自动巡检、异常诊断、慢SQL归因这些DBA日常最耗时间的工作，它全能接手。此外，它还构建了四层安全防线：权限隔离、AI行为护栏、架构安全与全链路审计，让DBA敢将生产库权限交付于它。

TDSQL Boundless，新一代分布式数据库。基于统一的分布式架构，支持关系型事务处理、向量语义检索与全文搜索等多种数据类型，多种访问模式与多种模型数据可在同一个连接、甚至同一个事务中完成，无需再为不同数据类型维护不同数据库。

TDSQL-C，云原生数据库全面升级。本次TDSQL-C重构的第三代存储架构AI Native Storage主打“稳、灾、省”三个字。业务无感的存储组件发布与坏盘替换，带来了极致性价比，TCO相较同类产品下降200%以上；IO零抖动，全链路无损变更；数据零丢失，3 AZ金融级强同步、RPO=0。依托第三代存储架构，TDSQL-C还系统化升级为面向AI时代的双引擎云原生数据库，内核采用PG与MySQL双引擎的云原生计算节点，可一站式对接腾讯云CloudBase的BaaS平台以及Cursor、FastGPT等AI开发者应用，通过MCP、REST等协议实现统一接入。

把这些产品放在一起看，可以清晰地看到腾讯云数据库在做的事：从底层的数据库引擎，到中间的记忆和运维能力，再到上层的AI开发体验，整套Agent时代的数据基础设施，正在用AI原生的思路全面重构。而Agent Memory正是其中与开发者关系最近的一环——它直接解决了“AI如何记住你”这个每个人都会遇到的实际问题。

开源地址：https://github.com/TencentCloud/TencentDB-Agent-Memory