DeepAgents:一站式复杂AI任务智能体框架,规划、沙盒与子代理开箱即用
Deep Agents 是一套基于 LangChain 和 LangGraph 的智能体基础套件,内建规划、文件系统交互以及子代理动态生成能力,专为应对高复杂度智能体任务而设计。
Deep Agents 提供开箱即用的 Agent 框架,用于搭建能够自主规划、对复杂任务进行推理、管理文件、执行 Shell 命令并将工作委派给专用子代理的 AI 代理——这一切都无需额外拼装提示词、工具和上下文管理逻辑。你拿到手的是一个立即可运行的智能体,同时保留了充分的定制空间。
破解 AI 代理的“浅层”困境
最简形式的 AI 代理仅仅是在循环中让大语言模型调用工具。然而这种架构往往流于表面,难以胜任跨多个回合、步骤繁多的复杂任务。像 Claude Code、Deep Research 和 Manus 这类应用通过融合四个关键要素突破了这一瓶颈:规划工具、子代理、对文件系统的访问以及详尽的系统提示词。Deep Agents 将这四种模式封装为一个可复用的 Python SDK,让你不仅能构建交互式终端,还能为自有应用打造具备深层能力的智能体。
其核心思想是:深度源自架构,而不仅仅来自模型。配备合理的中间件、工具抽象和上下文管理机制的智能体框架,能将能力强大 LLM 变成一套真正可靠的自主系统。
整体架构一览
Deep Agents 以 Python monorepo 的形式组织,包含多个独立版本控制的包。处于核心的是核心 SDK(deepagents),它提供 create_deep_agent() 工厂函数、中间件系统以及可插拔的后端抽象层。围绕核心 SDK 的是 CLI、编辑器集成、评估套件和沙盒合作伙伴等配套包。

六大内核能力:开箱即用的可组合工具
Deep Agents 附带六大内置能力类别,每一类均以可组合的中间件或后端组件形式实现:
| 能力 | 提供的工具 | 中间件 / 后端 |
|---|---|---|
| 规划 | 用于任务拆分与进度追踪的 write_todos | TodoListMiddleware |
| 文件系统 | read_file、write_file、edit_file、ls、glob、grep | FilesystemMiddleware + BackendProtocol |
| Shell 访问 | 执行命令(沙盒化)的 execute | SandboxBackendProtocol |
| 子代理 | 在隔离上下文中委派任务的 task | SubAgentMiddleware |
| 上下文管理 | 对话变长时的自动摘要 | SummarizationMiddleware |
| 记忆与技能 | 通过 AGENTS.md 持久化记忆,自定义斜杠命令 | MemoryMiddleware、SkillsMiddleware |
系统会自动包含一个名为 general-purpose 的通用子代理,无需额外配置即可提供内置任务委派能力。
双模式接入:SDK 集成与 CLI 交互
Deep Agents 提供两种主要接口,面向不同的使用场景:

| 特性 | Python SDK | CLI |
|---|---|---|
| 最佳场景 | 构建由代理驱动的定制应用 | 交互式终端工作流 |
| 安装 | pip install deepagents | curl -LsSf ... | bash |
| 定制化 | 对工具、中间件和后端的完全编程控制 | 配置文件与 CLI 标志 |
| 接口 | 返回 CompiledStateGraph 的 Python API | 流式响应的交互式 TUI |
| 沙盒 | 通过 backend= 参数使用任意后端 | 内置支持 LangSmith、Daytona、Modal、Runloop 等 |
| 无头模式 | 原生支持——直接调用图即可 | 通过 --headless 标志支持 |
| 网页搜索 | 可自行添加工具 | 内置 |
| 对话恢复 | 通过检查点器(checkpointers)实现 | 内置会话管理 |
CLI 封装了 SDK,并增添了交互式终端体验、网页搜索、对话持久化以及远程沙盒支持。
三步极速启动
只需两行代码即可通过 SDK 立即开始:
pip install deepagents
from deepagents import create_deep_agent
agent = create_deep_agent()
result = agent.invoke({"messages": [{"role": "user", "content": "Research LangGraph and write a summary"}]})
这个 Agent 会自动进行任务规划、读写文件、执行 shell 命令并管理自身对话上下文——全程无需任何配置。
设计哲学与关键原则
原生 LangGraph 集成。 create_deep_agent() 直接返回一个已编译的 CompiledStateGraph,意味着你可以无缝使用所有 LangGraph 特性——流式传输、检查点、人机协同中断以及 LangGraph Studio——无须任何适配层。
模型无关性。 Deep Agents 可搭配任何支持工具调用的 LLM。默认模型为 Claude Sonnet 4.6,你可以通过 provider:model 格式(如 openai:gpt-4o)切换至任意提供商。辅助函数 resolve_model() 负责处理各平台的初始化细节。
信任 LLM,沙盒化工具。 该项目遵循的安全模型是:“代理可以执行其工具允许的任何操作”——安全边界在工具与沙盒层面强制执行,而非寄望于模型自我约束。SandboxBackendProtocol 借助合作伙伴集成提供隔离的 shell 执行环境。
中间件优于平原工具。 中间件系统会在每次 LLM 请求发送前进行拦截,从而实现动态工具过滤、系统提示词注入、消息转换以及跨回合状态管理——这是普通 tools=[] 列表中的工具函数所无法做到的。