AI编程账单不再糊涂！开源工具claude-tap实时查看Claude Code等9大Agent每次API请求与Token消耗

June 20, 2026

每天用 Claude Code 写代码，一个月下来账单好几百刀。

但你是否确切了解这些开销都流向了哪里？

每次请求究竟发送了多少 token？system prompt 里隐含着什么内容？多轮对话的上下文是怎么一步步膨胀起来的？工具调用又消耗了多少资源？

这些关键信息，Agent 工具自己是不会主动告诉你的。

最近在 GitHub 上发现了一个名为 claude-tap 的项目，恰好能帮你透视 AI Coding Agent 的每一次 API 请求。

借助它，你不仅能看清 Agent 内部的工作机制，更能精确掌握每一笔 Token 的花销去向。

01 开源项目简介

claude-tap 是一个本地代理和 Trace 查看器。

通俗点讲，它就像一个套在你 AI Agent 外层的中间人，全面拦截所有 API 流量，并将每一次请求的细节无遗地记录下来。

system prompt、对话历史、工具定义、流式响应、token 用量，所有这些信息都变得透明可查。

最关键的一点是：只需一行命令就能启动，完全无需改变你现有的使用习惯。

而且它兼容性极强，目前已经支持 9 个主流的 AI Coding 客户端：

Claude Code、Codex CLI、Gemini CLI、Kimi CLI、OpenCode、Pi、Hermes Agent、Cursor CLI、Qoder CLI。

市面上你能叫得出名字的 AI 编程 CLI，几乎都被这工具一网打尽了。

02 它能干什么

看见真实上下文

你发给 AI 的每一句话、AI 收到的 system prompt、工具的参数 schema，以及流式响应的每一个 chunk：所有细节都能完整浏览。

这里查看的是货真价实的原始 API 请求与响应，并不是 Agent Loop 那种经过二次加工的信息。

相邻请求 Diff 对比

这个功能非常实用。

在多轮对话场景下，你可以直接对比相邻两次请求之间的所有变化——哪些消息被添加了，哪些被移除了，system prompt 中哪里的内容做了修改。

字符级的 diff 高亮，差异之处一目了然。

Token 用量分析

输入了多少 token，产出了多少 token，缓存命中多少，缓存又创建了多少。

所有数据按请求逐一拆解，每一笔消耗都分得清清楚楚。月底再看到账单时，你就能斩钉截铁地说出钱究竟花在了哪里。

实时查看器

只要加上 --tap-live 参数，工具就会自动打开浏览器。

Agent 在终端里一边运行，你在浏览器里一边实时观察。每当有新的 API 调用进来，页面就会即时刷新出一条记录。

离线归档

每次运行结束后，claude-tap 会自动生成一个自包含的 HTML 文件。

这个文件可以离线打开，也能分享给同事，丢到团队群里让大家共同 review，接收方完全不需要安装任何额外软件。

数据全在本地

所有 trace 数据都安全存放在你本机。无需注册账号，不用连接云端 dashboard。认证相关的 header 在记录之前会自动脱敏，绝不会泄露你的 API Key。

03 怎么用

安装仅需一行命令：

uv tool install claude-tap

或者使用 pip 来安装：

pip install claude-tap

安装完成即可直接使用。例如，你想观察 Claude Code 的 API 请求，只需要运行：

claude-tap

就这么简洁。之后你继续正常使用，等退出时工具会自动生成一个 HTML 查看器。

如果你希望一边运行一边观察，只需附加一个额外参数：

claude-tap --tap-live

切换到其他客户端也同样是单条命令的事：

# Codex CLI
claude-tap --tap-client codex
# Gemini CLI
claude-tap --tap-client gemini -- -p "hello"
# Kimi CLI
claude-tap --tap-client kimi
# Cursor CLI
claude-tap --tap-client cursor -- -p --trust --model auto "hello"

如果不希望附带启动客户端，只想单独开启代理，可以使用：

claude-tap --tap-no-launch --tap-port 8080

若想回看历史 trace，只需：

claude-tap dashboard

整套流程的上手成本几乎为零。装好即用，用完即看。

04 原理很简单

Image

claude-tap 的核心思路只走两条路：

对于支持自定义 base URL 的工具，比如 Claude Code、Codex CLI，它采用反向代理模式：将客户端请求指向本地代理，再由代理透明地转发到真正的 API。对客户端而言，这个过程是完全不可感的。

对于不支持修改地址的客户端，例如 Gemini CLI、OpenCode、Pi，它则使用正向代理模式：通过设置 HTTPS_PROXY 环境变量，把流量引导到本地，再借助自签名的 CA 证书完成 TLS 解密。证书装好后，一切对客户端依然是透明的。

所有流经代理的流量都会被实时记录为 JSONL 格式的 trace 文件。

在实时模式下，这些记录会通过 SSE 推送到浏览器；退出时，再将 trace 打包成自包含的 HTML。

整个流程就是如此简洁明了。没有任何花哨的复杂实现，就是稳稳地把流量拦下来、记下来、展现出来。

05 谁适合用

如果你每天都依赖 AI Coding Agent 写代码，特别是 Claude Code 的重度用户，那么这款工具几乎属于必装品类。

token 到底烧了多少、烧在了什么地方，你会从此心中有数。

如果你正从事 prompt 工程，想完整查看 system prompt 和上下文传递的整条链路，用 claude-tap 比自己去翻日志要方便成百上千倍。

如果你在带团队用 AI 编写代码，需要进行 Agent 行为审计、成本分析，了解 Agent 到底在做什么，那么这个工具生成的 HTML 文件，直接丢到群里就能满足所有需求。

如果你自己正在做 Agent 相关开发，需要调试 API 调用、排查问题，那么 claude-tap 就好比是 AI Agent 领域的 Wireshark。

开源地址：https://github.com/liaohch3/claude-tap