Free Claude Code 开源代理:用任意模型驱动 Claude Code,告别高价与封号困扰
Claude Code 的体验有口皆碑,这一点无需赘述。尽管 Anthropic 的一些策略时常引发争议,但工具本身依旧值得使用。不过,真正将它作为主力编程助手投入日常开发时,账单往往会变得非常醒目。尤其是那些需要 Agent 反复阅读代码、修改逻辑、跑测试的长时间任务,一个晚上下来,心跳几乎会跟着 API 调用次数的飙升一起加速。
更麻烦的是,Claude 对国内用户并不友好,订阅后封号风险高,很多时候开发者只能退而求其次去使用第三方模型。这两天,一个开源项目突然吸引了大量目光:Free Claude Code。

它并不是 Anthropic 官方推出的免费版 Claude Code,更不是破解或盗版。更准确地讲,它是一个本地代理服务,专门负责拦截 Claude Code 发往 Anthropic Messages API 的请求,并将其转发到其他模型服务上。
需要先说明一点:这篇文章不是在教大家白嫖官方 Claude,也不是说它能 100% 复制 Claude Sonnet 或 Opus 的能力。它解决的是一个非常直接的问题:让你继续使用 Claude Code 这个出色的客户端,但模型流量可以灵活地路由到 NVIDIA NIM、OpenRouter、Gemini、DeepSeek、Kimi、Ollama、LM Studio 等各类后端。

你熟悉的 Claude Code 工作流依然保存完好,而后端的模型则可以随心替换。
它的原理是什么
Free Claude Code 的核心是一个本地搭建的 FastAPI 服务。Claude Code 原本会将请求发给 Anthropic 的 API。而这个项目在你的本机启动一个代理,暴露出 /v1/messages、/v1/messages/count_tokens、/v1/models 这类与 Anthropic 兼容的接口,然后根据你的配置,把收到的请求分发给不同的 provider。
你可以把它理解为一个中间翻译层:

Claude Code 继续使用 Anthropic 的协议进行对话,后端的模型则可以是 OpenAI-compatible 接口、Anthropic Messages 风格接口,也可以是本地的 Ollama、llama.cpp 或 LM Studio。
Claude Code 本身最出色的地方,不仅是模型能力,而是那一整套完整的开发体验:读取项目上下文、修改文件、调用工具链、生成执行计划、跑命令、与 IDE 集成。Free Claude Code 的初衷,就是保留这套体验,同时把模型的选择权重新交回开发者手里。
README 里目前列出了 17 个 provider backend:NVIDIA NIM、OpenRouter、Google AI Studio、DeepSeek、Mistral、Mistral Codestral、OpenCode Zen、OpenCode Go、Wafer、Kimi、Cerebras、Groq、Fireworks AI、Z.ai、LM Studio、llama.cpp、Ollama。

这里面既有云端 API,也有本地模型。如果你想省钱,可以接入带免费额度的 provider;如果你更看重隐私,可以接本地的 Ollama 或 LM Studio;如果你只是想将 Opus、Sonnet、Haiku 这类不同模型的请求拆开,走不同的后端,它也支持按模型层级路由。
例如,README 中给出了这样的配置例子:
MODEL_OPUS=
MODEL_SONNET=
MODEL_HAIKU=
MODEL="nvidia_nim/nvidia/nemotron-3-super-120b-a12b"
未填写的 tier 会自动继承 MODEL 的值。这对重度用户来说非常实用——并非所有任务都需要最贵、最聪明的模型,改文案、补齐单元测试、扫描 lint、解释报错信息等场景,很多时候用便宜模型足够了。
安装方式很直接
macOS / Linux 环境:
curl -fsSL "https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.sh?raw=1" | sh
Windows PowerShell 环境:
irm "https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.ps1?raw=1" | iex
安装完成后,启动代理:
fcc-server
服务起来后,终端上会打印出本地 Admin UI 的地址,默认类似 http://127.0.0.1:8082/admin。在这个页面中可以填写各个 provider 的 key,选择模型,点击 Validate 验证连接,再点击 Apply 生效。
最后,使用下面的命令启动 Claude Code:
fcc-claude
fcc-claude 会读取当前代理端口和本地 auth token,自动帮你设置 Claude Code 所需的环境变量,然后再拉起真正的 claude 命令。
这里有一个细节需要留意:安装脚本是直接从 GitHub 拉下来执行的,最好事先打开 scripts/install.sh 或 scripts/install.ps1 快速浏览一遍。这类工具会改动本机命令和环境配置,养成先看一眼的习惯总没有坏处。
Admin UI 让配置更直观
早期类似的代理工具很容易陷入 .env 文件的混乱。Free Claude Code 现在把常用配置都放进了本地 Admin UI。README 里也明确建议,普通用户优先在 /admin 页面内修改设置,不要手工编辑托管配置文件。
它支持的 key 种类比较多,比如:
NVIDIA_NIM_API_KEY
OPENROUTER_API_KEY
GEMINI_API_KEY
DEEPSEEK_API_KEY
KIMI_API_KEY
GROQ_API_KEY
OLLAMA_BASE_URL
LM_STUDIO_BASE_URL
以 DeepSeek 为例,API Key 创建地址是:https://platform.deepseek.com/ 。

本地模型虽然不需要 API key,但你必须先把对应的服务跑起来。比如使用 Ollama:
ollama pull llama3.1
ollama serve
然后模型名应当按项目约定写成 ollama/llama3.1。LM Studio 的默认地址是 http://localhost:1234/v1,llama.cpp 的默认地址是 http://localhost:8080/v1。
这些本地方案听起来很有吸引力,但也要清醒地看到:Claude Code 对上下文理解、工具调用和代码推理的要求非常高。本地部署的模型受限于参数规模和硬件,实测中很难达到云端模型的满血状态,所以更推荐直接使用现成的 API 服务。
不止终端,还能接入 VS Code 和 JetBrains

这个项目的适用范围远不止终端。README 里详细写了 VS Code Extension 的配置方式,核心就是为 Claude Code 扩展添加环境变量:
"claudeCode.environmentVariables": [
{ "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:8082" },
{ "name": "ANTHROPIC_AUTH_TOKEN", "value": "freecc" },
{ "name": "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY", "value": "1" },
{ "name": "CLAUDE_CODE_AUTO_COMPACT_WINDOW", "value": "190000" }
]
JetBrains 系列 IDE 同样可以配置,不过需要修改 Claude ACP 的安装配置文件。对 IDE 用户而言,这个功能非常关键。很多人的日常开发已经沉淀在 VS Code 或 JetBrains 中,并不想为了 Agent 专门去切终端。能把同一个代理接入到自己熟悉的 IDE,使用成本会大幅降低。
项目还支持 Claude Code 的 /model 选择器,不过 README 里也写明了前置条件:需要打开 Gateway model discovery。


还能接入 Discord、Telegram 与语音

Free Claude Code 还有一个比较大胆的能力:把 Claude Code 会话接入 Discord 或 Telegram。

你可以配置 bot token、允许的聊天频道或用户 ID,再限制 ALLOWED_DIR 目录范围,从而让远程消息触发 Claude Code 任务。
它还支持语音笔记转文字,后端可以选择本地 Whisper,也可以走 NVIDIA NIM 的语音转写服务。设想一下,你在路上突然想到一个修复思路,直接给 Telegram bot 发一段语音,让它在你指定的项目目录中启动一个任务。等你回到电脑前,就可以直接查看 diff 和测试结果。
当然,这一块也更加敏感。远程 bot、代码执行、允许目录、API key,这些元素全堆在一起时,权限一定要收紧。尤其是 ALLOWED_DIR 这类配置,千万不要图省事直接放开整个 home 目录。能限定到具体项目目录,就一定要精确限定。
适合谁用
总体来看,Free Claude Code 最适合三类开发者。
第一类,是 Claude Code 的重度用户。你已经非常习惯 Claude Code 的交互流程,但又希望把一部分低风险的任务——比如解释代码、补齐单测、生成 README、做一些简单修复——切到更便宜的模型或免费额度上,从而显著降低整体使用成本。
第二类,是喜欢折腾多模型路由的人。在同一个 Claude Code 前端界面下,后面的模型可以按任务等级灵活分发:Opus 级请求走一个模型,Sonnet 级请求走另一个,普通 fallback 再走一个更廉价的模型,做到真正的按需按成本拆分。
第三类,是想在本地模型上试验 Agent 工作流的开发者。Ollama、LM Studio、llama.cpp 均被支持,虽然最终效果受限于模型能力和上下文长度,但至少为低成本试验提供了一个入口。
不太适合谁?如果你只追求官方 Claude Code 原汁原味的稳定体验,那确实没必要额外引入一层代理。中间环节越多,潜在变量也越多。provider 的限流、模型兼容性、工具调用的格式、流式输出的处理,都可能成为不稳定因素。
另外需要提醒的是,该仓库虽然热度很高且采用 MIT 协议,但 GitHub 上目前尚未发布正式 release,也没有 tag。pyproject.toml 里版本写作 2.0.0,要求 Python >=3.14.0。这意味着最好将它看作一个更新极快的开发者工具,而非一成不变的企业级产品。
最后
Free Claude Code 真正打动人心的,并不是名字里的 “free”。而是它牢牢抓住了一个务实的需求:大家喜爱 Claude Code 的开发体验,却不想每一个任务都被绑定在同一个模型和同一套计费体系上。
它把 Claude Code 变成了一个更加开放的前端。后面接免费额度、接廉价模型、接本地服务,全部由你自己决定。
当然,别把它想象成魔法。模型能力不足时,Agent 该犯错还是会犯错;provider 不稳定时,任务中断依旧难以避免;本地模型上下文有限,读大项目时照样会吃力。但如果你本来就使用 Claude Code,又想尝试多模型路由、降低部分场景的成本,或者将本地模型塞进 Agent 工作流中,这个项目非常值得好好研究一下。
GitHub 项目地址:
https://github.com/Alishahryar1/free-claude-code