AI编程账单不再糊涂!开源工具claude-tap实时查看Claude Code等9大Agent每次API请求与Token消耗
每天用 Claude Code 写代码,一个月下来账单好几百刀。
但你是否确切了解这些开销都流向了哪里?
每次请求究竟发送了多少 token?system prompt 里隐含着什么内容?多轮对话的上下文是怎么一步步膨胀起来的?工具调用又消耗了多少资源?
这些关键信息,Agent 工具自己是不会主动告诉你的。
最近在 GitHub 上发现了一个名为 claude-tap 的项目,恰好能帮你透视 AI Coding Agent 的每一次 API 请求。

借助它,你不仅能看清 Agent 内部的工作机制,更能精确掌握每一笔 Token 的花销去向。
01 开源项目简介
claude-tap 是一个本地代理和 Trace 查看器。
通俗点讲,它就像一个套在你 AI Agent 外层的中间人,全面拦截所有 API 流量,并将每一次请求的细节无遗地记录下来。

system prompt、对话历史、工具定义、流式响应、token 用量,所有这些信息都变得透明可查。
最关键的一点是:只需一行命令就能启动,完全无需改变你现有的使用习惯。
而且它兼容性极强,目前已经支持 9 个主流的 AI Coding 客户端:
Claude Code、Codex CLI、Gemini CLI、Kimi CLI、OpenCode、Pi、Hermes Agent、Cursor CLI、Qoder CLI。

市面上你能叫得出名字的 AI 编程 CLI,几乎都被这工具一网打尽了。

02 它能干什么
看见真实上下文
你发给 AI 的每一句话、AI 收到的 system prompt、工具的参数 schema,以及流式响应的每一个 chunk:所有细节都能完整浏览。
这里查看的是货真价实的原始 API 请求与响应,并不是 Agent Loop 那种经过二次加工的信息。

相邻请求 Diff 对比
这个功能非常实用。
在多轮对话场景下,你可以直接对比相邻两次请求之间的所有变化——哪些消息被添加了,哪些被移除了,system prompt 中哪里的内容做了修改。
字符级的 diff 高亮,差异之处一目了然。

Token 用量分析
输入了多少 token,产出了多少 token,缓存命中多少,缓存又创建了多少。
所有数据按请求逐一拆解,每一笔消耗都分得清清楚楚。月底再看到账单时,你就能斩钉截铁地说出钱究竟花在了哪里。
实时查看器
只要加上 --tap-live 参数,工具就会自动打开浏览器。
Agent 在终端里一边运行,你在浏览器里一边实时观察。每当有新的 API 调用进来,页面就会即时刷新出一条记录。
离线归档
每次运行结束后,claude-tap 会自动生成一个自包含的 HTML 文件。
这个文件可以离线打开,也能分享给同事,丢到团队群里让大家共同 review,接收方完全不需要安装任何额外软件。
数据全在本地
所有 trace 数据都安全存放在你本机。无需注册账号,不用连接云端 dashboard。认证相关的 header 在记录之前会自动脱敏,绝不会泄露你的 API Key。
03 怎么用
安装仅需一行命令:
uv tool install claude-tap
或者使用 pip 来安装:
pip install claude-tap
安装完成即可直接使用。例如,你想观察 Claude Code 的 API 请求,只需要运行:
claude-tap
就这么简洁。之后你继续正常使用,等退出时工具会自动生成一个 HTML 查看器。
如果你希望一边运行一边观察,只需附加一个额外参数:
claude-tap --tap-live
切换到其他客户端也同样是单条命令的事:
# Codex CLI
claude-tap --tap-client codex
# Gemini CLI
claude-tap --tap-client gemini -- -p "hello"
# Kimi CLI
claude-tap --tap-client kimi
# Cursor CLI
claude-tap --tap-client cursor -- -p --trust --model auto "hello"
如果不希望附带启动客户端,只想单独开启代理,可以使用:
claude-tap --tap-no-launch --tap-port 8080
若想回看历史 trace,只需:
claude-tap dashboard
整套流程的上手成本几乎为零。装好即用,用完即看。
04 原理很简单
Image
claude-tap 的核心思路只走两条路:
对于支持自定义 base URL 的工具,比如 Claude Code、Codex CLI,它采用反向代理模式:将客户端请求指向本地代理,再由代理透明地转发到真正的 API。对客户端而言,这个过程是完全不可感的。
对于不支持修改地址的客户端,例如 Gemini CLI、OpenCode、Pi,它则使用正向代理模式:通过设置 HTTPS_PROXY 环境变量,把流量引导到本地,再借助自签名的 CA 证书完成 TLS 解密。证书装好后,一切对客户端依然是透明的。
所有流经代理的流量都会被实时记录为 JSONL 格式的 trace 文件。
在实时模式下,这些记录会通过 SSE 推送到浏览器;退出时,再将 trace 打包成自包含的 HTML。
整个流程就是如此简洁明了。没有任何花哨的复杂实现,就是稳稳地把流量拦下来、记下来、展现出来。
05 谁适合用
如果你每天都依赖 AI Coding Agent 写代码,特别是 Claude Code 的重度用户,那么这款工具几乎属于必装品类。
token 到底烧了多少、烧在了什么地方,你会从此心中有数。
如果你正从事 prompt 工程,想完整查看 system prompt 和上下文传递的整条链路,用 claude-tap 比自己去翻日志要方便成百上千倍。
如果你在带团队用 AI 编写代码,需要进行 Agent 行为审计、成本分析,了解 Agent 到底在做什么,那么这个工具生成的 HTML 文件,直接丢到群里就能满足所有需求。
如果你自己正在做 Agent 相关开发,需要调试 API 调用、排查问题,那么 claude-tap 就好比是 AI Agent 领域的 Wireshark。
开源地址:https://github.com/liaohch3/claude-tap