Insights

AI Agent 浏览器利器 camofox-browser 解析：C++ 层指纹伪装与无障碍树快照突破反爬瓶颈

使用 Playwright 或 Puppeteer 做过 Web 自动化的开发者，大概率都撞上过这类僵局：刚刚访问几页，验证码就弹了出来；Cloudflare 的人机验证死死卡住流程；任务跑到一半，IP 就已经进了黑名单。

过去，常规思路是修改 navigator.webdriver、注入 JavaScript 补丁或覆写某些浏览器属性。初期的 stealth 插件确实有效，但如今大量反爬系统看的早已不是“你伪没伪装”，而是“你的浏览器环境有没有被改动过”。那些补丁本身反而会变成一种新的指纹特征。

最近，GitHub 上一个名为 camofox-browser 的项目正是为解决这一问题而生。它来自 jo 团队（YC W24），基于 MIT 协议开源，目前仓库已获得超过 5.6K Star 和 548 Fork。

它的目标很明确：为 AI Agent 提供一个更适合 Web 自动化的浏览器运行环境，尽可能降低被反爬系统识别的风险。

底层伪装，而非 JS 补丁

camofox-browser 底层依赖的是 Camoufox——一套经过深度定制的 Firefox 浏览器引擎。

它与普通 stealth 插件的关键区别在于，不在 JavaScript 层面临时打补丁，而是在 C++ 实现层面对浏览器指纹进行处理。例如 navigator.hardwareConcurrency、WebGL 渲染器参数、AudioContext 行为、屏幕几何信息、WebRTC 等常见指纹采集点，都在更靠近底层的位置被伪装。

这样做的好处是，页面脚本看到的不是“被 JS 修改过的浏览器”，而是一个天生就表现为另外一套环境的浏览器。相比运行时注入补丁，这种机制更不容易留下明显的修改痕迹。

当然，也不能说它就一定“能绕过所有反爬”。反检测始终是攻防博弈，只能说底层伪装在稳固性上比单纯的 JS 补丁更加扎实。

借助无障碍树压缩 Token 开销

对 AI Agent 来说，成功打开网页只是第一步，真正棘手的事情在后面：网页内容对 Token 的消耗实在太大。

Insights

AI编程效率翻倍！豆包输入法语音转文字深度评测与推荐

你是否也经常遇到这种情况：无论是写代码还是写文章，脑海里思路分明，可手指却总跟不上。敲了几分钟键盘，屏幕上才稀稀拉拉多了几十个字。于是你灵光一闪——如果能直接用嘴说，文字就自动出现，那该多省事。

这个想法完全可以靠语音转文字软件实现。但新的痛点随之而来：中文同音字词多，编码场景经常中英文夹杂，普通语音识别很容易出错，整体准确率偏低。

原因很简单——传统工具只是机械地将声音转成文字，缺乏语境理解。

可如果让AI介入，根据上下文对识别结果进行智能修正，识别准确率就能大幅提升。

这真是一个绝妙的主意！

事实上，这个赛道已经有不少产品在耕耘。我实测了几款主流的AI语音转文字工具，整理如下供你参考。

1. Typeless：多语言实时语音转写工具

官网地址： https://www.typeless.com

我使用谷歌账号登录。之后会有一套引导流程，帮助熟悉基本操作。

Typeless 的核心机制就是借助AI将用户的语音转成文字。在Mac上使用时，按下 Fn 键会弹出一个小图标，代表正在监听。

说完后再按 Fn，系统便进入“思考”阶段，随后借助AI生成文字。整体感受属于中规中矩。但需要“等待AI思考”这个间隙，体验上不够丝滑。

Typeless 最大的亮点在于多语言支持，它可以将你的语音实时翻译成其他语言。这一特性对跨境业务岗位尤其实用——与海外客户语音沟通时，能实时输出目标语言译文，显著降低交流障碍。

如果你使用过这款软件，欢迎在评论区分享你的场景。

总的来说，这款工具非常方便，在小红书上也有一定热度。但现实难题摆在眼前——价格不便宜。

Free用户每周只有8000个单词的额度，对高频使用者来说完全不够用。Pro版如果按年订阅，折合每月约12美元（约合人民币80多元），略显昂贵。


Image	Image

在海外市场这个定价或许可以接受，但在国内，许多普通用户的第一反应是“还是算了”。毕竟国内用户对软件付费普遍比较克制，这也是目前的消费习惯。

我还注意到了一个有趣的信息：Typeless官网显示创始人兼CEO是黄松，团队有斯坦福校友背景，实力不容小觑。

2. 千问AI助手：语音识别沦为导流工具

千问AI的语音转文字功能是作为子功能嵌在主程序里的，必须先下载完整的千问AI助手才能使用。

客观来说，AI语音识别是个好功能，但阿里明显是借此为千问AI主产品引流。

高情商评价： 没想到千问AI里面还藏了这么好用的语音识别功能。

低情商吐槽： 为了用个语音识别，还得装个这么重的软件，劝退感太强了。毕竟如果只是单纯做AI问答，Kimi、豆包、DeepSeek等都足以胜任，千问的独特优势似乎并不明显……

体验地址： https://www.qianwen.com

操作方式是按下右侧的Alt键。我在公司的Windows系统上试了，Mac未测试，整体感觉一般，识别不太准确。说完之后它也要“思考一会儿”才会输出文字，体验不太友好。

我个人对该方案兴趣不大。

3. 微信输入法：被低估的高效语音输入

很多人可能还不知道，微信竟然推出了自己的输入法？


Image	Image

下载地址： https://z.weixin.qq.com

不过在电脑端，目前我所看到的是只有Mac版支持AI语音转文字，Windows版暂未上线同等功能！

操作方式简单明了，提供两种模式。第一种是直接按住Fn键说话，松开结束，适合快速短句输入。当需要长篇输出时，则按Fn + Space 进入免提模式，系统会持续监听你的语音并实时转成文字。

整体体验其实不错，之前也是我Vibe Coding的一大帮手。只是偶有小bug：从英文输入法切回拼音后，有时按Fn启动语音识别会没反应，略感遗憾。

当然，微信输入法还提供了两个很实用的额外功能。

✅剪贴板： 可以保存你历史Ctrl+C复制过的内容，并随时调取粘贴。

Insights

AI编程智能调度神器9Router：实测Token消耗减半，免费模型零成本开发

在各类大模型套餐的实测与讨论中，评论区时常“炸锅”，但抛开对大厂的吐槽，最令我关注的还是大家的Token消耗量——动辄上亿的规模，可见AI编程工具已经深度融入日常开发。

alt

如今，Claude Code、CodeX等AI编程助手几乎成了写代码的标配。体验确实流畅顺手，可问题也很直接：额度烧得太快。一段冗长的报错日志，或者一坨巨大的代码diff，Token就在不知不觉中哗哗流失。若再遇上主力模型间歇性“抽风”，整个开发节奏就容易被中断，让人烦躁不已。

今天要聊的9Router，就是专门解决这类烦恼的调度枢纽。简而言之，它为AI编程工具装上了一套智能调度中心。

实测下来，接入9Router后，Token开销竟然比直接使用Claude Code减少了将近一半。这种感受非常实在，绝不是宣传噱头，而是实打实的节省。

核心亮点解析

RTK Token节省器：真正的节流引擎

这是9Router最具含金量的部分。

它能在后台自动压缩工具的输出内容，比如git diff、grep、ls等，使每次请求消耗的Token量大幅下降。官方宣称可节省20%–40%，以我的实测来看，这个数据非常靠谱。

它并不是看似高级实则无用的花架子，而是将RTK的压缩理念产品化，做成了易接入的方案。同一轮对话中，开启RTK后，Token消耗能明显感受到下降，省下的额度可以让你多跑几轮、多干些活。说白了，这就是在替你省真金白银。

三层自动降级，无感切换

9Router并非只连一个模型了事，它内置了一套三层自动降级逻辑。

第一层是你日常订阅的模型，比如Claude Code、Codex、GitHub Copilot等。
如果某层额度用尽，它会自动滑向下一层。

第二层是廉价模型，如GLM-5.1、MiniMax，单价很低，但输出质量仍然可接受。
若这层也扛不住，继续下探。

第三层则是免费模型，比如[REDACTED] AI、OpenCode Free、Vertex AI等，其中有些完全免费，有些则含免费额度。
整个过程基本无感知，不会让工作流突然卡住，也不用你手忙脚乱去切换配置。

这种设计非常适合当前“模型今天能用、明天或许不稳”的多变环境。

多账号轮换，积少成多

9Router支持在同一供应商下挂载多个账号，并自动轮换。这个思路很朴素：把零散的免费额度叠加起来一起用。
很多用户可能会忽略这一点，但实际用起来相当实用，能进一步把成本压到极致。

广泛兼容主流工具

别看名字小巧，9Router几乎能连接所有主流AI编程工具。Claude Code、Cursor、Cline、OpenClaw、Codex、Continue、Copilot等都在支持列表内。
只要你的工具兼容OpenAI API格式，就可以轻松挂载到9Router上，省去反复配置的麻烦。

快速上手指南

安装

最简单的方式是全局安装：

npm install -g 9router
9router

运行后，控制台仪表板通常会自动在浏览器中打开http://localhost:20128。

添加一个免费供应商

在仪表板的Providers页面，先配置一个免费提供商。建议优先尝试[REDACTED] AI或OpenCode Free。
前者无需注册即可使用Claude 4.5、GLM-5、MiniMax；后者更彻底，连认证都省了。

修改编程工具配置

接着，将Claude Code、Cursor、Cline等工具的请求地址改为：

Endpoint: http://localhost:20128/v1
API Key: 从仪表板复制
Model: kr/[REDACTED].5

配置完成后即可使用。本质上就是把原来直连模型的入口改为先进9Router，后续的路由、降级、Token压缩都由它替你接管。

从源码部署（可选）

如果打算本地开发或二次修改，也可以从源码启动：

cp .env.example .env
npm install
PORT=20128 NEXT_PUBLIC_BASE_URL=http://localhost:20128 npm run dev

生产环境部署也不复杂：

Insights

AI加量不加价：拥抱智能工具后，为何我们反而深陷加班旋涡？

在AI频繁融入工作的当下，我却越发觉得效率并没有提升，反而手头的事情越积越多。最初的设想很简单：把活计统统扔给AI，自己只需悠闲地刷手机。可现实远比想象棘手。完成初稿不过是工作的冰山一角，随后的环节接踵而至——领导会审核，叫你反复修改；说不定还得上公司会议接受集体评审；对外的交付成果也要经历核查，对方随时可能抛来各种提问。说白了，一旦你接手了某项任务，不仅要负责“售卖”，还要包揽全部的“售后”。正因为工作从来都不是一锤子买卖，很多职场老手才不愿意多揽活，因为他们知道，沾手的事再难甩脱。

而AI，只是帮你兜住了一开始的那一小截。剩下的，依然要你亲自扛。于是，你的主要时间都耗在了审核和确认文档上；那些交出去的东西，由于并非自己从头到尾全程构思，你总是担心被问到关键处时哑口无言，结果又得花大量时间去消化、去理解。这一通折腾下来，工作非但没变轻松，反倒更劳心劳力。

可领导并不清楚这些隐形的消耗，他们想当然地认为，既然给你配备了AI，你就该承担更多的产出。于是，一个讽刺的日常出现了：用上AI之后，大家的下班时间反而越来越晚。

我每天不仅要完成分内的工作，还得不断修复AI工具，给它装技能、手把手教它怎么做，就像带一个职场新人，而这新人还特别健忘。我不知道该如何摆脱这种处境。也许，从一开始我们就错了。AI被描述得太美好，以至于所有人都相信了，结果许多原本优秀的人反而陷入了与AI兜圈的怪圈，产出日益萎缩。休息时间被不断蚕食，有人甚至每天只睡四五个小时。我甚至觉得，像我们这些早早拥抱AI的人，其实是被AI套得最牢的那一群。那些不怎么用AI、或者只用问答类AI的人，反倒过得更舒坦。这么说来，AI工具目前恐怕还停留在实验阶段，远未到真正普及或民用的成熟期。我们这群人，不过是ChatGPT和Claude Code的试验品罢了，陪着它们演练，还自己掏着钱。一直绕弯路，只想着能比别人快一步，结果却要付出十倍的辛苦。这一切，到底值不值得？

Insights

AI信息差克星：5个硬核网站让你时刻紧跟前沿技术

下面介绍的这五个网站，集实时AI动态、硬核技术教程与全网热榜于一身，是日常拓展视野、消除信息差的极佳工具。坚持浏览，必有奇效。

GitHub热门项目趋势榜

**✅地址：**https://gitcn.org/trending

该平台可展示GitHub上按日、周、月筛选的热门仓库。翻阅这些高热度项目的源码，常常能吸收大量优质实践经验。举两个长期霸榜的案例：其一是大名鼎鼎的Superpowers技能包。

**✅地址：**https://github.com/obra/superpowers

其二是前特斯拉AI总监Andrej Karpathy的个人AI规范项目。

**✅地址：**https://github.com/forrestchang/andrej-karpathy-skills

这两项长时间占据榜单前列，热度极高。混个脸熟后，你难免会好奇它们为何能一直霸榜——点进去仔细研读，必定收获满满，此言不虚。

支持按时间维度（日、周、月）和编程语言灵活筛选，方便你精准定位感兴趣的领域。

还可以根据编程语言进一步细化。

L站——技术极客的深度聚集地

L站汇聚了众多技术大牛，社区内沉淀了大量硬核教程。从搭建中转站、AI工作流设计，到Codex与Claude Code教程、网站上线与SEO技巧，甚至CPA操作指南……内容干货密度极高。

每天早上花十几二十分钟快速扫一遍，就能有效防止漏掉关键信息。

许多后来流传甚广的硬核教程，源头都指向这里。不过，访问该站需要特殊网络环境，且平台采用邀请制，普通用户无法注册，也不能留言互动，但可以浏览部分公开文章。

V2EX——对新人格外友好的开发者社区

V2EX又被称作V站，社区里活跃着大批程序员和技术先行者。它对新手相当友好，开放注册，氛围相对小众而轻松。很多人在这里分享个人见解、行业趣闻，非常适合“吹水”放松。若有不错的开发创意，或想晒出自己Vibe Coding的作品，也容易收获中肯的点评。

站内划分了多个板块，比如【酷工作】，经常有人发布内推岗位，或交流职场中遇到的难题，讨论质量相当有见地。

全平台实时热榜聚合站

**✅地址：**https://newsnow.busiyi.world/c/hottest

这个网站将国内外几乎所有主流平台的热榜一网打尽。你可以在【更多】选项中收藏偏好的平台，之后切换到【关注】标签页，便会只显示你订阅的那些热榜，信息获取效率极高。

以下是一个已配置的关注热榜范例，可供参考。

卡兹克AI热度榜——实时捕获AI热点

卡兹克是公众号中AI领域的头部创作者，常年输出高质量的AI教程与技巧，内容非常扎实。

他的团队还开发了一个网站，可以实时抓取最新的AI热点动态。想进一步缩小信息差的话，不妨关注。

**✅地址：**https://newsnow.busiyi.world/c/hottest

Insights

AI学习路径与项目全景图：压力即动力，普通人如何搭建AI知识体系实现求职突破

近期，我与几位AI教育领域的资深从业者深入交流，他们的观点让我深有共鸣：

学员在目标明确的情况下，学习成效会明显提升，尤其是以找工作为驱动时。

对此，我十分认同。为什么目标感会带来这样的变化？下面这张图或许能直观地给出答案：

概括起来就是：危机即压力，压力即动力。在我接触的学员中，大约五分之一的人抱着找AI相关工作的强烈诉求，而这批人确实学得格外刻苦，并且普遍取得了亮眼的成绩。

因此，我认为我们所提供的学习项目，本质上是帮大家找准方向——提供清晰的学习地图、关键节点与节奏，营造浓烈的社群氛围，并在学员遇到卡点时给予靠谱的解答，避免让他们长期陷入困惑。

听到这里，不少人可能会产生一个疑问：

AI行业难道这么不值钱、没有门槛？光靠努力就能成功？

真实情况恰恰相反：AI行业的进入壁垒很高，但做Demo的门槛却很低，这种割裂感值得深思。换句话说就是：

当前AI领域信息差巨大，鱼龙混杂，很多企业自身也未必真正内行，因此在招聘端存在很大的弹性空间——这意味着，现阶段进入AI行业确实存在红利。

但要特别强调的是，这并非指“包装欺骗”的空间变大，而是因为大家的认知水准普遍相近。只要稍微多下一点功夫，就能迅速甩开多数人。

再者，真正做过生产级AI项目的人与没做过的人，认知鸿沟犹如天堑。而真正完整经历过并交出成果的人本来就少之又少，所以行业真实的格局是：少数几个顶尖专家、一批靠勤奋杀出重围的准专家，以及海量的AI认知小白：

因此，对普通人来说，想在红利初期分一杯羹，绝不应该把自己定位成大佬或实践高手，而应成为一个能帮上大佬忙的、肯下笨功夫的靠谱角色。更进一步讲：

你只需比80%的AI求职者稍微突出一点就够了，而近两年，这个空间极其可观。

那么，这个空间到底有多么显著？我们来看一些真实的学员案例：

上述只是我这里的部分案例，若将视野拉大至更多的 AI 岗位，热度便会扑面而来：

可以看出，AI 赛道在全行业不甚景气的背景下逆势上扬，极具投入价值。随之而来的问题便是：到底如何才能踏入AI赛道？该学什么，为什么学，怎么学？

要回答这个问题，得先从企业的视角切入。

企业视角：AI究竟在做什么？

行业内流传着一句话：“在AI时代，如果你学得慢，就什么都不用学了。”

之所以这么说，是因为AI世界的三年，变化之快几乎抵得上人间的十年：

今天才发布Manus，明天就冒出了Lovart；
Cursor还没用熟，Claude Code 已经实质上成为AI编程的王者；
刚刚还在琢磨提示词怎么写，业内大佬便直言RAG已过时，并顺势抛出上下文工程；
还没感叹完Coze竟然开源了，Google Nano Banana 又在朋友圈刷了屏；
飞书发布会浓墨重彩地介绍多维表格，钉钉立即跟进，强势推出AI表格；
医疗AI明星OpenEvidence达到120亿美元估值，法律AI Harvey估值也逼近110亿；
OpenClaw爆火，掀起“百虾大战”；
……

于是，想入行的同学难免焦虑：这么多模型、这么多应用、这么多新东西，该怎么学，怎么学得动，又如何跟得上？

譬如，光是我随手收集的当前投身AI的公司，就已经构成一幅极为复杂的版图：

这时，需要我们往回拉一拉。跟上AI时代，其实有清晰的方法论。不要被前面那堆模型和产品吓住，从实际使用的角度来看，它们不外乎三大类：

工具增强型AI：效率放大器

首先是工具增强型AI，其出现的初衷就是提升工作效率，最典型的代表便是AI Coding。

但这类Agent有一个显著的缺陷：它以协同为主，其逻辑是放大个人的能力，使用者自身能力越强，就越能得心应手。因此，它的门槛高。工具增强型AI要求用户对AI输出的内容具备判断力，必须能识别好坏并知道如何优化，否则很容易抓瞎。

业务流程型AI：替代人工的精密系统

其次是业务流程型AI，它的目标不是增强个人，而是直接替代人或流程。也就是大家常听说的“蒸馏员工”，比如近来火爆的“同事.skill”“张雪峰.skill”……

这一品类的典型代表是AI客服、AI医生、AI律师，它们追求极高的准确性，容不得差错。这意味着用户可以是一个完全的小白，完全信赖AI提供的内容，无需自行判断。

正因为对准确性要求严苛，这类项目实现成本极高，上线后还需要建立多层保障与兜底机制。举个例子：我曾做过一个此类项目，两年内为公司节省了上千万，但一次事故就瞬间蒸发掉两百万，这种反差非常惊人……

内容生产型AI：低门槛的创意工具

最后是内容生产型Agent，这类直接用就好，门槛极低：

综上所述，虽然AI全景图看起来异常复杂，但说到底无非就是这三类项目：工具增强、业务/流程替代、AIGC。每一类又可以按照不同深度拆解出多样的项目类型。而不同的项目类型又对应不同的技术路径，技术路径最终决定了员工需要完成的任务。任务一明确，我们必须掌握的技能也就变得清晰起来：

普通人的破局之道

现在回到最现实的问题：***普通人如何进入AI行业？***我的回答非常明确：

算法岗位门槛高、岗位少，普通人不要凑这个热闹。
AI的真正机会，更多在业务落地和AI应用工程上。

为什么要这么说？因为绝大多数公司根本不会涉足底层模型训练。如果你真的想进入AI行业，需要格外关注的是：

AI应用到底有哪些类型；
不同类型项目的各自难点在哪里；
Agent、Workflow、知识库、AI Coding 分别解决什么问题；
企业真正会为哪些AI能力买单；
进入团队后，你最可能接触到的工作到底是什么；
……

这一点至关重要，因为太多人一上来就学偏了，在一些无关紧要的地方反复折腾。企业真正在乎的是：一个真实的AI项目，到底是怎么从0到1跑起来的，难点和卡点在哪，谁能做，要花多少钱，能不能再快一点……

Insights

Anthropic开源Claude Code插件合集：精选5款高效开发必备工具

用 Claude Code 写代码的朋友，应该都用过不少斜杠命令（slash command），比如代码审查、提交、循环执行任务这类。日常够用，也很好用。

但问题同样明显：这些命令的行为基本是固定的。比如你想让代码审查自动检查团队内部规范，想让 Claude 在执行危险命令前先拦一下，或者想把「需求分析 → 方案设计 → 编码 → Review → 提交」这条链路打包成一套自己的工作流，单靠内置命令就不太够了。

过去想定制这些东西，通常得自己写 Skill、配 Agent、接 MCP，门槛不算低。

最近 Anthropic 在 GitHub 上开源了一个项目，名为 claude-plugins-official。我写这篇时，这个仓库已经有 2.7 万多 Star、3000 左右 Fork。它做的事情也很直接：把原本需要自己折腾半天的 Claude Code 工作流，打包成插件，一条命令装进 Claude Code。

粗略看了一下，仓库里分两块：/plugins 放 Anthropic 团队维护的插件，/external_plugins 放合作伙伴和社区提交的第三方插件。

Anthropic 公司官方维护的高质量 Claude 插件开源项目

这些插件覆盖开发、数据库、部署、安全、设计、项目协作等场景。它不是简单给你多几个快捷命令，而是把一整套开发工作流、外部工具接入方式和默认配置打包成插件，让你一条命令装进 Claude Code。

一个 Claude Code 插件，就是一个按约定组织好的目录。必需文件是 .claude-plugin/plugin.json，其他能力按需放，比如 slash command、agent、skill、MCP 配置、README，部分插件还会带脚本或 LSP 相关配置。

Claude Code 插件 —— claude-code-setup

官方目录里已有不少外部服务插件，如 Asana、GitHub、GitLab、Firebase、Linear、Playwright、Terraform，覆盖面已从项目协作、代码托管，扩展到数据库、部署、基础设施和测试自动化。

安装也简单，一行命令：

/plugin install {插件名}@claude-plugins-official

或者直接在 Claude Code 里输入 /plugin，进 Discover 界面浏览安装。

Insights

AtomCode Coding Plan 免费领取攻略：DeepSeek‑V4‑Flash 与 Qwen3.6 无限畅用，限时 30 天！

又一款 Coding Plan 真香福利：DeepSeek‑V4‑Flash、Qwen3.6 不限量使用，速领！

作为常年测评各类编程 Plan 的博主，我在第一时间上手体验，结论是——确实能爽用！下面直接上硬货教程。

01 领取 AtomCode CodingPlan 超简单

先下载 AtomCode，并在应用内领取 Coding Plan Lite 套餐。
用你的 AtomGit 账号登录 AtomCode 编辑器，然后在对话框中输入 /codingplan 指令，即可完成领取。

AtomCode CodingPlan 领取

⚠️ 注意：Lite 套餐每日限量 500 个名额，成功领取后30 天内有效，记得及时激活。

02 认识一下 AtomCode

AtomCode 是一款于 2026 年 4 月开源的本地化 AI 编程终端智能体，完全由 Rust 构建，被誉为 Claude Code 的国产开源平替。

换句话说，它是 CSDN 团队捣鼓出来的纯 Rust、MIT 许可的终端 AI 编码助手，轻量、快速、完全本地运行。

AtomCode 介绍

03 两行命令极速安装

直接照搬官方说明，一行命令搞定安装：

# Windows 安装（PowerShell） irm https://atomgit.com/atomgit_atomcode/atomcode/releases/download/v4.22.0/install.ps1 | iex

装好后，在终端输入 atomcode 即可启动。接着通过扫码或链接登录，就能解锁 CodingPlan 免费额度，不限次数调用支持的模型：

Insights

Claude Code 子代理与多代理协作实战指南：15+模板打造AI编码军团

如果不用子代理，Claude Code 就像孤军奋战——前端、后端、测试一手抓，效率低下还容易出错。子代理能将 Claude Code 从“单打独斗”升级为“军团作战”，每个 AI 各司其职，专业任务交由专业 AI 处理。

子代理是 Claude Code 的“AI 专家团队”：你定义不同的专业角色，Claude 自动派遣或由你手动调度。子代理运行在独立上下文中，不污染主对话，任务完成后只返回摘要。本文涵盖 17 个配置字段、15 个可复制的实战模板、多 AI 协作的代理团队、Fork 模式，拿来即用。

快速认识子代理与代理团队

子代理是什么？

一句话概括：子代理是一个运行在独立上下文窗口中的专业化 AI 助手，处理完任务后将摘要传回主对话。

常见做法是你让 AI “帮我搜索所有 Controller 的代码”，AI 读取几十个文件后，主对话上下文被大量搜索结果撑满。而使用子代理时，你派遣一位专用 AI 去搜索，它在自己隔离的上下文中工作，最后只把摘要返回给你，主对话始终保持干净。

你下达任务 → Claude 派遣子代理 → 子代理在独立上下文中执行 → 返回摘要到主对话

为什么必须使用子代理？

没有子代理	有子代理
代码搜索结果塞满上下文，后续对话卡顿	子代理独立搜索，主对话只接收摘要
审查代码与编写代码共享同一上下文	审查由子代理承担，主对话专注编码
复杂任务只能串行处理	多个子代理并行处理不同任务
无法限制 AI 只能进行只读操作	子代理可细化工具权限（只读/只写）
上下文压缩后关键信息大量丢失	子代理拥有独立的上下文窗口

Claude Code 四大配置体系

前三篇文章已介绍了 CLAUDE.md、Hooks、Skills，本文讲解第四大配置——子代理：

配置	本质	触发方式	适用场景
CLAUDE.md	项目规范说明书	自动加载（每次会话）	告诉 AI 项目约定
Hooks	自动化规则	事件触发（自动）	格式化、拦截、通知
Skills	技能包	手动调用（`/skill-name`）	代码审查、文档生成
Agents	AI 专家团队	自动派遣或手动调用	上下文隔离、并行处理

Claude Code 配置体系

Insights

Claude Code使用体验大吐槽：强制适配、生态割裂与傲慢的陷阱

首先，Claude Code 只能读取自己 .claude 文件夹里的 skill，这种做法多少有点霸王条款的意思。潜台词就是：只许你们来适配我，别指望我去适配你们。毕竟 skill 的标准规范由我 Claude Code 制定，你们只能乖乖照做。

除此之外，还有一点让我非常不舒服——它的 skills 文件夹居然不允许在里面新建子文件夹来收纳 skill，所有的 skill 文件必须摊开摆成一排。我明明做了好几个不同类别的 skill 集，却只能按它的方式平铺在那，找起来麻烦得很。你很难想象一堆 skill 毫无层级地摆在那里有多难受，我只是想把不同类型的 skill 分类存放而已，这个要求很过分吗？随便就能递归读取的事情，怎么就不能尊重一下用户体验呢？

更离谱的是那个项目级的约束文件，其他工具都叫 AGENT.md，唯独它必须叫 CLAUDE.md。我在同一个工作空间里要用两个工具，结果不得不保留两份内容一摸一样的 md 文件，这种被迫的蠢事真的让人抓狂。

再来说说适配其他模型的问题。

我接入过 MiMO、hy3 等各种国产模型，每一个都遇到了适配上的麻烦。

比如上下文压缩。我用 hy3 的时候，上下文压缩就从来没成功过，最后逼得我只能每次重新开对话，搞不清到底是模型的问题还是 Claude Code 的责任。

再比如缓存命中彻底失灵。我用 MiMO 2.5 的时候，感觉 token 像在疯狂燃烧，也就折腾了一个下午，直接干掉我 99 元套餐里 25% 的 token 量。而同样的工作换成 Codex，哪怕受着 ChatGPT 的五小时限制，也只用了 30% 的额度。这个落差，我找谁去说理去？不让接别的模型，干脆直说算了。

最大的问题是，Claude Code 太把自己当成世界的中心了。

.claude 文件夹、CLAUDE.md、skills、commands、插件……所有东西都必须围绕着它那一套目录结构来运转。当然，作为官方产品，它可以这么设计，生态也是它先建立起来的，可我这种同时使用多个 AI 工具的人，体验就会立刻变得割裂。

明明其他工具都遵循着相近的约定，偏偏到你这里搞特殊。

所以我眼下对 Claude Code 的态度非常矛盾。

我承认它强，承认它的生态完善，也承认在很多场景下它依旧是 AI 工具里的标杆。但我也越来越不想把自己彻底绑死在它身上。