Free Claude Code 开源代理：用任意模型驱动 Claude Code，告别高价与封号困扰

June 6, 2026

Claude Code 的体验有口皆碑，这一点无需赘述。尽管 Anthropic 的一些策略时常引发争议，但工具本身依旧值得使用。不过，真正将它作为主力编程助手投入日常开发时，账单往往会变得非常醒目。尤其是那些需要 Agent 反复阅读代码、修改逻辑、跑测试的长时间任务，一个晚上下来，心跳几乎会跟着 API 调用次数的飙升一起加速。

更麻烦的是，Claude 对国内用户并不友好，订阅后封号风险高，很多时候开发者只能退而求其次去使用第三方模型。这两天，一个开源项目突然吸引了大量目光：Free Claude Code。

它并不是 Anthropic 官方推出的免费版 Claude Code，更不是破解或盗版。更准确地讲，它是一个本地代理服务，专门负责拦截 Claude Code 发往 Anthropic Messages API 的请求，并将其转发到其他模型服务上。

需要先说明一点：这篇文章不是在教大家白嫖官方 Claude，也不是说它能 100% 复制 Claude Sonnet 或 Opus 的能力。它解决的是一个非常直接的问题：让你继续使用 Claude Code 这个出色的客户端，但模型流量可以灵活地路由到 NVIDIA NIM、OpenRouter、Gemini、DeepSeek、Kimi、Ollama、LM Studio 等各类后端。

你熟悉的 Claude Code 工作流依然保存完好，而后端的模型则可以随心替换。

它的原理是什么

Free Claude Code 的核心是一个本地搭建的 FastAPI 服务。Claude Code 原本会将请求发给 Anthropic 的 API。而这个项目在你的本机启动一个代理，暴露出 /v1/messages、/v1/messages/count_tokens、/v1/models 这类与 Anthropic 兼容的接口，然后根据你的配置，把收到的请求分发给不同的 provider。

你可以把它理解为一个中间翻译层：

Claude Code 继续使用 Anthropic 的协议进行对话，后端的模型则可以是 OpenAI-compatible 接口、Anthropic Messages 风格接口，也可以是本地的 Ollama、llama.cpp 或 LM Studio。

Claude Code 本身最出色的地方，不仅是模型能力，而是那一整套完整的开发体验：读取项目上下文、修改文件、调用工具链、生成执行计划、跑命令、与 IDE 集成。Free Claude Code 的初衷，就是保留这套体验，同时把模型的选择权重新交回开发者手里。

README 里目前列出了 17 个 provider backend：NVIDIA NIM、OpenRouter、Google AI Studio、DeepSeek、Mistral、Mistral Codestral、OpenCode Zen、OpenCode Go、Wafer、Kimi、Cerebras、Groq、Fireworks AI、Z.ai、LM Studio、llama.cpp、Ollama。

这里面既有云端 API，也有本地模型。如果你想省钱，可以接入带免费额度的 provider；如果你更看重隐私，可以接本地的 Ollama 或 LM Studio；如果你只是想将 Opus、Sonnet、Haiku 这类不同模型的请求拆开，走不同的后端，它也支持按模型层级路由。

例如，README 中给出了这样的配置例子：

MODEL_OPUS=  
MODEL_SONNET=  
MODEL_HAIKU=  
MODEL="nvidia_nim/nvidia/nemotron-3-super-120b-a12b"

未填写的 tier 会自动继承 MODEL 的值。这对重度用户来说非常实用——并非所有任务都需要最贵、最聪明的模型，改文案、补齐单元测试、扫描 lint、解释报错信息等场景，很多时候用便宜模型足够了。

安装方式很直接

macOS / Linux 环境：

curl -fsSL "https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.sh?raw=1" | sh

Windows PowerShell 环境：

irm "https://github.com/Alishahryar1/free-claude-code/blob/main/scripts/install.ps1?raw=1" | iex

安装完成后，启动代理：

fcc-server

服务起来后，终端上会打印出本地 Admin UI 的地址，默认类似 http://127.0.0.1:8082/admin。在这个页面中可以填写各个 provider 的 key，选择模型，点击 Validate 验证连接，再点击 Apply 生效。

最后，使用下面的命令启动 Claude Code：

fcc-claude

fcc-claude 会读取当前代理端口和本地 auth token，自动帮你设置 Claude Code 所需的环境变量，然后再拉起真正的 claude 命令。

这里有一个细节需要留意：安装脚本是直接从 GitHub 拉下来执行的，最好事先打开 scripts/install.sh 或 scripts/install.ps1 快速浏览一遍。这类工具会改动本机命令和环境配置，养成先看一眼的习惯总没有坏处。

Admin UI 让配置更直观

早期类似的代理工具很容易陷入 .env 文件的混乱。Free Claude Code 现在把常用配置都放进了本地 Admin UI。README 里也明确建议，普通用户优先在 /admin 页面内修改设置，不要手工编辑托管配置文件。

它支持的 key 种类比较多，比如：

NVIDIA_NIM_API_KEY  
OPENROUTER_API_KEY  
GEMINI_API_KEY  
DEEPSEEK_API_KEY  
KIMI_API_KEY  
GROQ_API_KEY  
OLLAMA_BASE_URL  
LM_STUDIO_BASE_URL

以 DeepSeek 为例，API Key 创建地址是：https://platform.deepseek.com/ 。

DeepSeek 创建 API Key

本地模型虽然不需要 API key，但你必须先把对应的服务跑起来。比如使用 Ollama：

ollama pull llama3.1  
ollama serve

然后模型名应当按项目约定写成 ollama/llama3.1。LM Studio 的默认地址是 http://localhost:1234/v1，llama.cpp 的默认地址是 http://localhost:8080/v1。

这些本地方案听起来很有吸引力，但也要清醒地看到：Claude Code 对上下文理解、工具调用和代码推理的要求非常高。本地部署的模型受限于参数规模和硬件，实测中很难达到云端模型的满血状态，所以更推荐直接使用现成的 API 服务。

不止终端，还能接入 VS Code 和 JetBrains

这个项目的适用范围远不止终端。README 里详细写了 VS Code Extension 的配置方式，核心就是为 Claude Code 扩展添加环境变量：

"claudeCode.environmentVariables": [  
  { "name": "ANTHROPIC_BASE_URL", "value": "http://localhost:8082" },  
  { "name": "ANTHROPIC_AUTH_TOKEN", "value": "freecc" },  
  { "name": "CLAUDE_CODE_ENABLE_GATEWAY_MODEL_DISCOVERY", "value": "1" },  
  { "name": "CLAUDE_CODE_AUTO_COMPACT_WINDOW", "value": "190000" }  
]

JetBrains 系列 IDE 同样可以配置，不过需要修改 Claude ACP 的安装配置文件。对 IDE 用户而言，这个功能非常关键。很多人的日常开发已经沉淀在 VS Code 或 JetBrains 中，并不想为了 Agent 专门去切终端。能把同一个代理接入到自己熟悉的 IDE，使用成本会大幅降低。

项目还支持 Claude Code 的 /model 选择器，不过 README 里也写明了前置条件：需要打开 Gateway model discovery。

还能接入 Discord、Telegram 与语音

Free Claude Code 还有一个比较大胆的能力：把 Claude Code 会话接入 Discord 或 Telegram。

你可以配置 bot token、允许的聊天频道或用户 ID，再限制 ALLOWED_DIR 目录范围，从而让远程消息触发 Claude Code 任务。

它还支持语音笔记转文字，后端可以选择本地 Whisper，也可以走 NVIDIA NIM 的语音转写服务。设想一下，你在路上突然想到一个修复思路，直接给 Telegram bot 发一段语音，让它在你指定的项目目录中启动一个任务。等你回到电脑前，就可以直接查看 diff 和测试结果。

当然，这一块也更加敏感。远程 bot、代码执行、允许目录、API key，这些元素全堆在一起时，权限一定要收紧。尤其是 ALLOWED_DIR 这类配置，千万不要图省事直接放开整个 home 目录。能限定到具体项目目录，就一定要精确限定。

适合谁用

总体来看，Free Claude Code 最适合三类开发者。

第一类，是 Claude Code 的重度用户。你已经非常习惯 Claude Code 的交互流程，但又希望把一部分低风险的任务——比如解释代码、补齐单测、生成 README、做一些简单修复——切到更便宜的模型或免费额度上，从而显著降低整体使用成本。

第二类，是喜欢折腾多模型路由的人。在同一个 Claude Code 前端界面下，后面的模型可以按任务等级灵活分发：Opus 级请求走一个模型，Sonnet 级请求走另一个，普通 fallback 再走一个更廉价的模型，做到真正的按需按成本拆分。

第三类，是想在本地模型上试验 Agent 工作流的开发者。Ollama、LM Studio、llama.cpp 均被支持，虽然最终效果受限于模型能力和上下文长度，但至少为低成本试验提供了一个入口。

不太适合谁？如果你只追求官方 Claude Code 原汁原味的稳定体验，那确实没必要额外引入一层代理。中间环节越多，潜在变量也越多。provider 的限流、模型兼容性、工具调用的格式、流式输出的处理，都可能成为不稳定因素。

另外需要提醒的是，该仓库虽然热度很高且采用 MIT 协议，但 GitHub 上目前尚未发布正式 release，也没有 tag。pyproject.toml 里版本写作 2.0.0，要求 Python >=3.14.0。这意味着最好将它看作一个更新极快的开发者工具，而非一成不变的企业级产品。

最后

Free Claude Code 真正打动人心的，并不是名字里的 “free”。而是它牢牢抓住了一个务实的需求：大家喜爱 Claude Code 的开发体验，却不想每一个任务都被绑定在同一个模型和同一套计费体系上。

它把 Claude Code 变成了一个更加开放的前端。后面接免费额度、接廉价模型、接本地服务，全部由你自己决定。

当然，别把它想象成魔法。模型能力不足时，Agent 该犯错还是会犯错；provider 不稳定时，任务中断依旧难以避免；本地模型上下文有限，读大项目时照样会吃力。但如果你本来就使用 Claude Code，又想尝试多模型路由、降低部分场景的成本，或者将本地模型塞进 Agent 工作流中，这个项目非常值得好好研究一下。

GitHub 项目地址：
https://github.com/Alishahryar1/free-claude-code