Claude Code 子代理与多代理协作实战指南:15+模板打造AI编码军团
如果不用子代理,Claude Code 就像孤军奋战——前端、后端、测试一手抓,效率低下还容易出错。子代理能将 Claude Code 从“单打独斗”升级为“军团作战”,每个 AI 各司其职,专业任务交由专业 AI 处理。
子代理是 Claude Code 的“AI 专家团队”:你定义不同的专业角色,Claude 自动派遣或由你手动调度。子代理运行在独立上下文中,不污染主对话,任务完成后只返回摘要。本文涵盖 17 个配置字段、15 个可复制的实战模板、多 AI 协作的代理团队、Fork 模式,拿来即用。
快速认识子代理与代理团队
子代理是什么?
一句话概括:子代理是一个运行在独立上下文窗口中的专业化 AI 助手,处理完任务后将摘要传回主对话。
常见做法是你让 AI “帮我搜索所有 Controller 的代码”,AI 读取几十个文件后,主对话上下文被大量搜索结果撑满。而使用子代理时,你派遣一位专用 AI 去搜索,它在自己隔离的上下文中工作,最后只把摘要返回给你,主对话始终保持干净。
你下达任务 → Claude 派遣子代理 → 子代理在独立上下文中执行 → 返回摘要到主对话
为什么必须使用子代理?
| 没有子代理 | 有子代理 |
|---|---|
| 代码搜索结果塞满上下文,后续对话卡顿 | 子代理独立搜索,主对话只接收摘要 |
| 审查代码与编写代码共享同一上下文 | 审查由子代理承担,主对话专注编码 |
| 复杂任务只能串行处理 | 多个子代理并行处理不同任务 |
| 无法限制 AI 只能进行只读操作 | 子代理可细化工具权限(只读/只写) |
| 上下文压缩后关键信息大量丢失 | 子代理拥有独立的上下文窗口 |
Claude Code 四大配置体系
前三篇文章已介绍了 CLAUDE.md、Hooks、Skills,本文讲解第四大配置——子代理:
| 配置 | 本质 | 触发方式 | 适用场景 |
|---|---|---|---|
| CLAUDE.md | 项目规范说明书 | 自动加载(每次会话) | 告诉 AI 项目约定 |
| Hooks | 自动化规则 | 事件触发(自动) | 格式化、拦截、通知 |
| Skills | 技能包 | 手动调用(/skill-name) | 代码审查、文档生成 |
| Agents | AI 专家团队 | 自动派遣或手动调用 | 上下文隔离、并行处理 |
Claude Code 配置体系
Claude Code使用体验大吐槽:强制适配、生态割裂与傲慢的陷阱
首先,Claude Code 只能读取自己 .claude 文件夹里的 skill,这种做法多少有点霸王条款的意思。潜台词就是:只许你们来适配我,别指望我去适配你们。毕竟 skill 的标准规范由我 Claude Code 制定,你们只能乖乖照做。
除此之外,还有一点让我非常不舒服——它的 skills 文件夹居然不允许在里面新建子文件夹来收纳 skill,所有的 skill 文件必须摊开摆成一排。我明明做了好几个不同类别的 skill 集,却只能按它的方式平铺在那,找起来麻烦得很。你很难想象一堆 skill 毫无层级地摆在那里有多难受,我只是想把不同类型的 skill 分类存放而已,这个要求很过分吗?随便就能递归读取的事情,怎么就不能尊重一下用户体验呢?
更离谱的是那个项目级的约束文件,其他工具都叫 AGENT.md,唯独它必须叫 CLAUDE.md。我在同一个工作空间里要用两个工具,结果不得不保留两份内容一摸一样的 md 文件,这种被迫的蠢事真的让人抓狂。
再来说说适配其他模型的问题。
我接入过 MiMO、hy3 等各种国产模型,每一个都遇到了适配上的麻烦。
比如上下文压缩。我用 hy3 的时候,上下文压缩就从来没成功过,最后逼得我只能每次重新开对话,搞不清到底是模型的问题还是 Claude Code 的责任。
再比如缓存命中彻底失灵。我用 MiMO 2.5 的时候,感觉 token 像在疯狂燃烧,也就折腾了一个下午,直接干掉我 99 元套餐里 25% 的 token 量。而同样的工作换成 Codex,哪怕受着 ChatGPT 的五小时限制,也只用了 30% 的额度。这个落差,我找谁去说理去?不让接别的模型,干脆直说算了。
最大的问题是,Claude Code 太把自己当成世界的中心了。
.claude 文件夹、CLAUDE.md、skills、commands、插件……所有东西都必须围绕着它那一套目录结构来运转。当然,作为官方产品,它可以这么设计,生态也是它先建立起来的,可我这种同时使用多个 AI 工具的人,体验就会立刻变得割裂。
明明其他工具都遵循着相近的约定,偏偏到你这里搞特殊。
所以我眼下对 Claude Code 的态度非常矛盾。
我承认它强,承认它的生态完善,也承认在很多场景下它依旧是 AI 工具里的标杆。但我也越来越不想把自己彻底绑死在它身上。
Claude Code自媒体创作效率翻3倍实战指南:视频脚本、推广方案与素材整理全流程
上周发布了Claude Code的安装教程后,有朋友问到:“有没有详细的使用指南?”今天就为所有已经装好Claude Code但还不清楚从何下手的朋友,梳理一下它的使用方法和高效技巧。
在指导学员的过程中我发现,许多人装上Claude Code之后的典型使用方式是:打开黑色终端窗口,一股脑把所有任务丢进去,然后等着结果,不满意就再说一遍,最后觉得效果平平。问题并不在于Claude Code本身能力不行,而是你的互动方式出了偏差。接下来我会通过三个真实场景的拆解,带你掌握正确的使用姿势。
场景一:自媒体博主如何用Claude Code写视频脚本
做过自媒体的人都知道,写视频脚本往往是工作量最大、也最容易卡壳的环节。脑子里虽然有一个大致方向,但一下笔就反复删除,磨蹭一个小时出来的东西连自己都不满意。用Claude Code来辅助写作,可以这样操作。
第一步:先制定计划,锁定方向。打开Claude Code后,不要直接让它开写,而是让它先帮你规划方向。很多人一上来就提需求,让工具直接动手,结果做到一半才发现跑偏了,只能推倒重来。无论是脚本还是其他任务,这一步都极其关键。直接按下Shift+Tab就可以切换到计划模式,看到提示符变成英文即表示切换成功。

然后输入指令:“我想做一期关于AI工具提效的视频,目标受众是做自媒体的普通人,给我三个不同的切入角度。”它并不是直接甩出答案,而是先去微信指数上搜索热门话题,再梳理出具体方向。最后它给出了直击自媒体博主痛点的三个选题方向:剪辑、账号启动、作品制作省时间。整个过程不到五分钟,就科学地完成了分析。
上下滑动查看更多

第二步:方向敲定之后,让它完成完整脚本。接着告诉它:“选择角度一、用‘省时间’这个视角,帮我写一个3分钟的视频口播脚本。开头要有强钩子,中间给出两个真实使用场景,结尾引导关注。我的风格是口语化,像朋友聊天,不要说教感。”

当然,它生成的初稿不会直接采用,但整个骨架已经搭建好了,你只需要把那些不够顺口的地方改成自己说话的味道,这比自己从零想快得多。
第三步:把脚本变成提词文件。稿件确认后,在Claude Code中告诉她:“把这个脚本做成一个可以在浏览器打开的提词页,背景黑色,字体白色大字,每段之间留空,方便我对着屏幕念稿。”几分钟后,就会生成一个HTML文件,效果如下。
上下滑动查看更多

用浏览器打开后,它就是你的专属提词器,拍摄时可以直接对着屏幕念。如今大多数提词器都要收费,而利用Claude Code完全可以自己制作出来。按照这套流程,一小时内就能出稿,连提词文件都一并完成。
场景二:职场人或运营如何用它做市场推广方案
做品牌或运营的人经常要撰写推广方案。过去的做法是:自己搭框架、查资料、写文档,写完后还要做成漂亮的汇报格式,从头到尾耗上一整天。现在可以拆成三步,每一步交给合适的工具。
第一步:同样先用Claude Code寻找方向。进入计划模式后,告诉它:“我要给一个新品牌做市场推广方案,目标是3个月内冷启动,给我三个不同的切入角度。”因为我输入的是新品牌,它并不会直接给一个通用模板,而是先跟你确认具体需求,比如在这里就会主动询问品牌品类、用户画像等信息。

然后,它针对具体需求给出了三个极具参考价值的优质角度:“痛点爆款内容引流 → 免费体验 → 付费转化”、“个人IP + 真实故事信任路径”、“社群先行 + UGC裂变社区模式”。

第二步:方向定下来之后,让它生成完整文档。接着对它说:“用第二个角度,帮我输出一份完整的推广方案,包含目标用户画像、核心卖点、推广节奏和每周执行建议,做成文档格式。”

这一步把内容骨架全部拉了出来,你只需要填充那些只有你自己清楚的业务细节就够了。
第三步:把方案转化为汇报页面。方案文档已有,直接告诉它:“把这份推广方案做成网页形式的工作汇报展示页,用HTML格式,要有封面页、核心策略页和执行计划页,整体风格偏高端商务提案。”几分钟后,一个可以在浏览器直接打开的汇报页便制作完成,带有统一的配色、排版和分页,拿给客户或者领导看,就像是专业团队出品的效果。下图就是展示效果:
上下滑动查看更多

全程你只做了一件事:选择方向。
场景三:批量整理素材,告别杂乱文件夹
做自媒体的人,电脑里一定会有这种情况:录屏、截图、素材、草稿全部堆在同一个文件夹里,时间跨度长达几个月,文件名全是系统自动生成的那种——录屏2024-11-03、录屏2024-11-07……每次找一个文件都要翻许久,极其恼人。我之前就是这个状态,有个文件夹里堆了100多个录屏,有时候要找某一天的素材,滑动五分钟都没找着。于是,我决定试试看Claude Code能不能帮我整理,就在存放素材的文件夹内打开终端。

我只说了一句话:“帮我按照录制日期把这些录屏分别放到以日期命名的子文件夹里。”它立即开始读取每个文件的日期信息,自动创建子文件夹,然后逐个把文件移入对应的日期目录。

几分钟后,100多个文件整理完毕,完全按时间节点帮我梳理清楚了。(还有几个文件没有处理是因为我打开了文件。)

这件活儿以前至少要花我两个小时,而且做的时候心里还充满烦躁。现在它几分钟就搞定了,我只不过说了一句话。当然,不光是录屏,素材文件夹、截图库、产品图片……凡是你觉得乱七八糟但一直没精力整理的文件,都可以用同样的方式处理。你只需要告诉它规则,它来动手,你去喝杯水,回来就什么都就绪了。
最后,还是要强调一件事:在使用Claude Code之前,先做好一项准备工作——编写你自己的CLAUDE.md文件。这个文件是给Claude Code的说明书,告诉它你是谁、你在做什么。写好之后每次启动都会自动读取,你再也不用每次都重新自我介绍。
比如你可以这样写:“我是做自媒体的,方向是AI工具。目标受众是自媒体博主和运营。帮我写内容时,语气口语化,不要AI腔。”就这么几句话,以后它给你的内容会越来越贴合你的风格,越用越顺手。
今天说的这三个场景,全都是最基础的入门玩法。遇到问题欢迎在评论区留言交流。
Claude递归自我改进路线图:代码产出8倍暴增、实验速度飙至52倍,Anthropic首次披露内部实测
#递归自我改进 #AI研发加速 #Claude

Anthropic罕见地公开了内部数据:Claude已经将工程师的代码产出提升至2021–2025年水平的8倍,实验速度则在一年内从3倍跃升到52倍。这不再是单纯的“提效工具”,而是整个AI研发流程正在被AI自己重新编织。
从辅助编码到接管完整研发循环
过去一年,“AI加速研发”早已被奉为行业共识,但究竟加速到何等程度、能否反过来驱动下一代的AI,一直缺乏可验证的实证。6月4日,Anthropic同步通过官网和社交平台披露了内部研究,罕见地展示了代码贡献率、实验速度和研究判断力三条曲线的详尽数据,并首次将“递归自我改进”从理论假设推入内部的研发路线图。


核心数据集中在两个维度。在工程方面,截至2026年5月,Anthropic合并到生产系统里的代码超过80%由Claude撰写;作为对比,2021年至2025年同期数据还是个位数。产出的变化直观可见:2026年第二季度,每位工程师日均合并代码量达到2024年的8倍。在科研方面,同一项实验任务,Claude Opus 4(2025年5月)平均只带来约3倍的速率提升,而Claude Mythos Preview(2026年4月)已跃升到约52倍。一位熟练的人类研究员跑完类似的优化实验,通常需要4到8小时才能达到4倍速。
内部研发角色的三阶压缩
Anthropic内部采用了一套简单的分层标准来描述角色的进阶:早期员工执行别人指定的具体任务;积累经验后被交付“目标”,需要自己设计实现路径;最资深的阶段则是负责决定“下一个季度该解决什么问题”。Claude的能力正由浅入深地替代前面这三个层级。
在工程侧,Claude已经能够接管粗粒度的需求描述,并自主寻找解决方案;在科研侧,它对于“目标清晰、实验步骤明确”的研究任务,已经可以匹敌熟练的研究者。真正依旧存在差距的,是“判断哪些目标值得投入”这一决策层面。这恰恰是递归自我改进能否成立的关键关口:只要AI还不能自主选择科研方向,人类就依然是闭环中不可替代的决策节点。
文章中有一个细节值得深究:2026年4月,Anthropic让Claude独立执行了一个端到端的安全研究项目,目标是测试弱模型能否可靠地监督强模型。两名人类研究员花费一周时间只找回了约23%的能力差距;而AI agent通过800小时、大约1.8万美元的算力开销,完成了97%的差距恢复。方向选取与评分标准仍由人类设定,但假设生成、实验设计和迭代工作全部由AI自动完成。
三种可能路径,不同的时间尺度
Anthropic为自身的递归自我改进规划了三条可能路线。第一种,当前的能力增长曲线骤然走平。这可能源于S曲线的拐点、算力或能源供给的瓶颈,或者监管的强力冲击。第二种,效率持续滚雪球式提升,但人类仍牢牢掌握方向设定和结果审核。公司内部已经出现这类迹象:人类代码评审正在变成新的瓶颈,而新想法、新工具、新实验的数量已经超出了团队的消化能力。第三种,AI获得足够的研究品味与实验设计能力,开始自行设计并训练下一代模型,真正的递归闭环就此形成。
文中给出的最关键判断是:“研究品味可能只是另一种AI会暂时失败、然后再次变强的能力。”从讲解幽默、推断心理理论,到解决语言谜题,AI已经反复复现了“先不行、再超预期”的曲线。正因如此,Anthropic自己对第三条路线虽然不作承诺,但也未将其视为遥远的假设。
普通人能切身感受到的三重影响
第一重是研发效率本身。2026年中期已经浮现出一种新现象:一个100人的团队借助AI agent的产出,在部分任务上可以等效过去1000人的规模。这并非理论推演,而是代码提交量、实验迭代速度、漏洞发现数量等硬指标直接给出的结论。
第二重是验证窗口正在急剧收窄。Anthropic提到,Glasswing项目已经能够在数周之内发现上万处高危漏洞,网络安全防御的瓶颈已从“发现”转向“修复速度”。同理,如果AI自主设计下一代模型的速度超过了人类设计验证机制的速度,安全对齐就不再是纯粹的研究课题,而会演变成工程竞速的困局。
第三重是竞争格局的质变。Anthropic明确表示,如果能够构建有效的暂停或减速验证机制,他们愿意在全球其他前沿实验室同步执行时主动暂停。但训练运行比导弹发射井更易于隐藏,所需的inputs是通用硬件,参与者叛离的激励极大。这种不对称意味着,任何相信“递归自我改进会在某一年到来”的人,都必须同时面对一个拷问:谁来验证大家真的已经停下了脚步。
回到普通人的视角,这篇文章最值得被带走的问题不是“AI会不会取代你”,而是“你的工作流里,有哪些环节正在被AI代理接管,以及你能否分辨哪些环节其实已经不再需要人来操作了”。
自查是否已进入加速区间的三个简单信号
- 你或身边的同事是否还在“手写代码”,还是只剩下“指导Claude写代码”这一动作。
- 实验从“提出需求到获得结果”的耗时是否在按月缩短,而非按年迭代。
- 团队近期新增的想法、工具或实验是否已经多到无法全部推动执行。
来源:Anthropic, “When AI builds itself” https://www.anthropic.com/institute/recursive-self-improvement
Claude官方Office四件套Skill完全指南:替代插件的更优选择
之前我们介绍过安装Codex后必装的5个插件,有读者反馈在插件商店中无法找到这些插件。其实不必纠结,Claude官方推荐的Office四件套skill是一个更成熟的选择,实际体验甚至比那些插件更顺手。本文将逐项解析这四款技能工具,并提供完整的下载与使用思路。

首先,如果你确实想继续使用插件,但又搜不到,直接把我整理好的版本拿过去就好。虽然成因难以解释,但解决起来很简单:把文件放入对应目录即可。

解压后,复制到 .codex\plugins\cache\openai-primary-runtime 这个文件夹内,插件就能正常工作。

不过,其实完全不必焦虑。因为备选方案不仅存在,而且更好——那就是安装Claude推荐的Office四件套skill。

经过我自己的多轮测试,这套skill的整体表现明显优于Codex的Office插件。以Excel处理为例,可以直观看出差距。
Codex上的对应模块叫spreadsheets,我研究后发现它主要通过Node.js来操作表格。

Claude的skill名为xlsx,核心则是用Python注入逻辑。

两者选用了不同的技术路线,但就实际任务而言,xlsx所生成的表格在排版上更加合理,单元格该合并的会恰当地合并,重点数据也会自动突出显示。而spreadsheets面对复杂表格时常难以保持结构,合并后的单元格内容甚至会丢失。由于涉及的文件不便公开,就不上对比截图了,但结论非常清晰:Claude的Office skill做得更细致、更可靠。
Claude Office技能套件的下载与安装
下载地址:https://github.com/anthropics/skills
主要下载以下四项,其余的可暂时不管。

下载完成后,把这四个文件夹放入你的skill库,AI就能自动识别调用。如果访问GitHub有困难,我在前面提到的插件安装包里也已将这四个skill一并打包,可以一并获取。
四大技能详解:能力与使用边界
1. docx:Word文档处理
docx 专门处理 .docx 文件,原理是把Word文档当作一个压缩包来拆解和重组。虽然听起来奇怪,但.docx本身就是XML文件的集合,AI会先解压读取正文、样式、批注、修订记录等信息,按规则修改后再重新打包。
新建文档时,它主要依赖 docx-js 这类Node.js库;读取或转换时则可能调用 pandoc、LibreOffice 或命令行工具辅助处理。
它非常适合处理报告、方案、合同初稿、会议纪要、简历以及模板类文档,尤其在标题层级、页码、表格、目录和页眉页脚这些地方,比普通AI直出要规整得多。
但是,边界也很清楚。包含复杂宏、嵌入对象或古怪模板控件的Word文档,以及严重依赖特定字体和本地环境的排版,它可能无法完全还原。老旧 .doc 格式需要先转换为 .docx。所以它更适合规范文档的生成与编辑,而非神奇修复祖传模板乱码。
2. pdf:PDF文件处理
PDF本质上像一张定型的“纸”,所以处理时不能只抽取文字,还要理解文本的布局、表格边界和图片位置。
该技能会用到Python的 pypdf、pdfplumber、reportlab 等库,也可能借助 qpdf、pdftotext、pdfimages 这类命令行工具。对于扫描件,还会走 pytesseract 和 pdf2image 的OCR流程。
需要特别注意的是PDF的能力边界:如果PDF是文字型(能用鼠标选中文字),提取内容、拆分合并、提取表格、添加水印、填写表单等任务都比较可靠。若为图片转成的PDF(比如扫描件或截图),就只能依靠OCR,此时识别效果取决于图片清晰度、倾斜程度、字体和背景干扰,模糊的合同或盖了章的文件很难完全准确。
另外,PDF里的表格提取并非总是完美,很多表格只是视觉上像表格,底层并没有实际的单元格结构。AI会尽量还原,但复杂合并单元格、跨页表格等仍需人工核对。总体而言,PDF技能适合做资料读取、内容抽取和基础加工,面对扫描件和复杂表格时必须人工审阅。
3. pptx:演示文稿制作
PPT不像Word重结构、Excel重数据,它更看重视觉呈现。AI做PPT最容易出的问题不是“写不出内容”,而是“看着不像人做的”。
这个 pptx skill的思路比较完整:读取时用 markitdown 提取文字,分析时会将幻灯片转成缩略图,编辑时拆解PPT的XML结构,必要时用LibreOffice和Poppler渲染成图片检查效果。新建PPT则使用 pptxgenjs 等Node.js工具。
它的亮点不止于生成,还特别强调检查——文字是否溢出、元素是否重叠、占位符是否意外残留、颜色对比度是否足够,这些都是PPT翻车的重灾区。
但PPT的边界同样明显。AI的审美发挥有时会突然倒退到“标题加五个项目符号”的古早风格,这时候不要绝望,继续让它对照渲染图片反复修订就好。PPT很少能一步到位,人审多修才是常态。
4. xlsx:电子表格与数据处理
xlsx 面向 .xlsx、.xlsm、.csv、.tsv 等表格文件,核心工具链是Python。数据清洗和分析主要用 pandas,Excel文件读写、公式、样式和合并单元格则用 openpyxl。遇到公式计算时,还会调用LibreOffice重新计算一遍,并自动检查 #REF!、#DIV/0!、#VALUE! 等常见错误。
ClawCloud跑路后最优之选:搬瓦工日本CN2 GIA VPS深度评测与推荐
官网已发布《ClawCloud VPS 及相关服务下线及退款安置公告》,自 2026 年 6 月 30 日起,将正式关停 VPS、VDS 等业务。


据圈内消息,ClawCloud 实际上是某知名国内云厂商的马甲。至于为何停摆,推测或许是因为团队转向 AI 赛道,对传统 VPS 生意不再上心;也可能流量补贴成本过高,难以为继。不论原因为何,它确实要走了。此前香港区域就已发生过一次下线,这次干脆整个 VPS 产品线都砍掉了,令人颇感惋惜。毕竟这种高性价比的机器,如今真的可遇不可求。
趁着早前促销,笔者也曾入手两台云服务器:一台是 4核8G、80GB 磁盘、2TB 流量、200M 带宽的 VDS,年付 67 美元。

另一台为 4核16G、200GB 磁盘、1G 带宽、2TB 流量的中国网络优化服务器,月付仅需 18 美元。

上面托管了几个网站,包括个人博客 vonng.com、Pigsty 中文站 pigsty.cc,以及 PostgreSQL 中文站镜像 pg.center。
坦白讲,要在当下再找到同样价位且符合需求的云服务器,并非易事。需求清单很明确:
- 需全球可访问,且中国大陆地区访问量较大(国内云服务器需排除)。
- 每月流量约 1TB,网络速度越快越好。
- 延迟越低、稳定性越高越佳,必须走精品线路(因此锁定 CN2 GIA)。
- 还必须能在上面正常访问 ChatGPT 和 Claude(香港节点因此出局)。
由于要承受密集的中国大陆访问,目前的最优区域无疑是日本。从上海访问日本服务器,延迟与香港相差无几,但香港 IP 无法使用 ChatGPT 与 Claude,价格还往往高出一截。新加坡的延迟要到 70–100ms,美西更是超过 120ms,而日本 CN2 GIA 的延迟最快能压到 30–40ms。
ClawCloud 的中国优化服务器其实并未走 CN2 GIA 网络,上海延迟约 60–70ms,晚高峰带宽表现也不太理想。因此趁这次迁移,正好一步到位,直接上最好的线路。
Codex Computer Use 实测:AI 直接操作电脑,鼠标点击输入全自动,能帮你打游戏吗?
周末,Codex 为 Windows 用户带来了两个期待已久的新功能:一个是 Codex 移动端正式上线,另一个则是 Computer Use 能力的加入。移动端这边,因为网络环境的限制,我暂时还没能在手机上成功调用起来。

不过转念一想,移动端对我的实际帮助可能有限——大多数工作仍然要在电脑上完成,手机最多只是遥控指挥,那些需要反复调试、仔细检查的操作在手机上实在不太顺手。既然用不了,那就先放一放,不必强求了。
接下来重点聊聊 Computer Use。

OpenAI 为 Windows 版 Codex 推出的 Computer Use,官方给出的说明很简洁:让 Codex 看见、点击和输入 Windows 应用。这意味着什么呢?从前 AI 帮你做事,大多是改改文件、跑几条命令、查一些资料,而现在它真的开始动用鼠标了。
我脑海里冒出一个大胆的想法:能不能让它替我打游戏?
于是立刻动手安装,想着干脆让 AI 帮我把英雄联盟冲上王者……

如何安装与启用 Computer Use
安装过程非常简单,只需点击对应图标即可完成。

使用步骤
点击“立即试用”后,程序便会开始运行。界面上全是英文,我没仔细看,于是直接下指令,让它打开我电脑上的 QQ 音乐。

转眼之间,电脑里传出音乐声。这可是 AI 为我播放的第一首歌,细想起来还挺有纪念意义的。

需要特别注意的是,Windows 版的 Computer Use 会直接在前台操作当前桌面,它会移动鼠标、点击按钮、模拟输入。如果在它忙碌的时候你也去抢鼠标,它就可能被迫中断并重新同步界面——刚才我在测试 QQ 音乐时就碰到了这个情况。所以,当 AI 正在干活时,最好先别和它争夺电脑的控制权。
试用下来,我觉得现阶段让它打游戏未免有些强人所难。目前的功能还比较初级,复杂的高级操作还是先别指望了。
哪些任务更适合交给它?
目前我更推荐从一些小型任务开始尝鲜。
1. 亲手测试自己开发的软件
使用 Computer Use 打开桌面客户端,复现登录后的报错。找到最小问题范围,修改代码后重新走一遍相同流程。
这种场景对程序员尤其友好。很多问题在命令行里根本无法察觉,只有真正点开界面才会暴露出来。
2. 调整桌面软件中的设置项
打开这个软件的设置页面,帮我找到通知选项。先告诉我当前状态,不要直接修改。
当设置入口藏得很深时,自己一层层翻找的确很恼人。让 AI 先帮你定位,体验会一下子舒畅不少。
Codex 接入国产大模型完全指南:用 CC Switch 一站式配置 Kimi、DeepSeek 等
喜大普奔!昨天,CC Switch 迎来了一个重要更新。
现在,你不仅可以在 CC Switch 中自由配置国产大模型,还能将它们接入 Codex!
如果你还不了解 CC Switch,这里先简单介绍一下:它是 GitHub 上一个热度极高的开源项目。

目前,该项目的 star 数已经突破 85K,社区活跃度可见一斑。
GitHub 地址:
https://github.com/farion1231/cc-switch
熟悉 Claude Code 的朋友应该知道,想要在 Claude Code 中使用国产模型,往往需要手动修改 baseURL,过程相对繁琐。而 CC Switch 就是为解决这一痛点而生的,它能让你非常便捷地在不同模型的接口地址之间进行切换。
比如,你可以在 Claude Code 中轻松调用 DeepSeek、智谱 GLM、Kimi,甚至小米的 MiMo 模型……

上图就是我的实际配置,已经接入了 DeepSeek、Kimi 和小米模型。
回到这篇文章的核心:如何在 CC Switch 中配置 Codex,并用上国产模型?
下面,我就以在 Codex 中使用 Kimi 模型为例,一步步带大家操作。

1、安装 CC Switch
作者已经贴心地为 Windows 和 Mac 用户准备好了安装包,开箱即用。

我们直接到 Release 页面下载最新版本。
下载地址:
https://github.com/farion1231/cc-switch/releases/tag/v3.16.0
将页面拉到最底部,你会看到如下界面。
Codex 免账号突破周限额:用 Codex++ 接入国产大模型完整教程
Codex 虽然功能强大,但不少用户在使用一两天后就触发了周限额,甚至频繁需要验证码或干脆无法登录。要是一开始就接入国产大模型,这些问题便能迎刃而解——不仅成本更低,服务更稳定,还能在限额时切换到充裕的模型,比如量足管饱的 DeepSeek。以下方法借助开源项目 CodexPlusPlus,可以无缝接入国产 API,连登录卡顿都不再出现,同时还能解锁丰富的插件生态。
首先,前往项目主页下载对应平台的最新版本:
https://github.com/BigPizzaV3/CodexPlusPlus
在页面右侧的「Release」一栏中,找到适合你操作系统的安装包,下载并进行安装。

安装完成后,系统会多出两个应用:

接下来,准备一个国产大模型的 API Key,比如 DeepSeek、MiniMax、Kimi、豆包等。
DeepSeek 的 API Key 获取地址为:https://platform.deepseek.com,其他模型可自行搜索注册。
准备工作就绪后,按以下步骤设置:
- 打开「Codex++ 管理工具」,点击「供应商配置」。

- 选择「添加供应商」。

- 在弹出界面中,名称栏可以任意填写;接入方式选择「纯 API」;再将「Codex 目标」下方的「启用目标功能」勾选。

- 接着依次填入:Base URL(对应模型的接口地址),Key 栏粘贴你的 API Key,上下游协议选「Chat Completions」。完成后点击「从上游获取」拉取可用模型列表。

- 保存设置,然后返回主界面。

- 回到首页后,供应商列表中已经出现刚才添加的模型。点击「使用」并选择「重启 Codex++」。每一次改用国产模型时,都需要从这个入口重新启动。

- 之后会进入登录界面。如果你已有 ChatGPT 账号,可以直接登录;若没有账号,也可以用刚才配置的国产模型 API Key 登录。

用 API Key 登录的方式如下:

进入主界面后,即可看到已经配置好的国产模型。

点击插件面板,会发现原本被限制的插件生态也已解锁。

通过这套方案,不仅彻底绕开了账号登录的种种限制,还能自由调用高性价比的国产大模型,让 Codex 的使用体验再上一个台阶。
Codex 生产力提升实战:8个让你事半功倍的隐藏技巧
我用 Codex 也有一段时间了。最初只是让它帮忙改代码、写文档、跑命令,觉得挺方便。后来慢慢察觉,同一款工具,不同人用出来的效果天差地别。
拉开差距的,往往是一些“用着用着才悟出来”的技巧。这些技巧藏在你踩过的坑里,藏在你零碎的操作记录里,官方文档和教程反而很少提及。
这篇就是把这段时间零碎记录下来的心得、踩过的坑、吐槽完想通的东西整理一下,算是一份“用了一阵子以后回头看,早知道这些就好了”的汇总。
善用免费工具探路,让 Codex 专注核心任务
这是我最看重的使用习惯。
我现在一般让 Codex 负责写代码,然后用豆包、元宝这类免费 AI 单独开一条项目开发对话。遇到不懂的直接问豆包,需要一步步操作的事情也复制进去,让它手把手教我。
这样做的好处是双重的:不污染 Codex 的对话上下文,也不浪费宝贵的 Token 额度。
Codex 的 Token 是要花钱的,或者说额度是有限的。用它来问“这个命令怎么用”“这条报错是什么意思”,纯属浪费资源。这些简单的事,免费工具完全能胜任。
把 Codex 的额度留给它真正擅长的地方:写代码、做方案、梳理项目、处理复杂任务。基础的知识问答和操作指导,通通交给免费工具。
这条思路用顺手以后,你会发现自己的产出效率有明显跃升。记住,要把它的能力用在最该用的地方。
长内容提供文件路径,避免直接粘贴对话
碰到报错日志、大段代码、长文档,很多人的第一反应是复制粘贴到对话里让 AI 自己找答案。
千万别这么做。
把一万行日志粘进对话,这些内容就会永久占据你的上下文空间,每多一轮对话都要重新“读”一遍。更聪明的做法是把文件路径发给 AI,让它自己按需检索信息,只将相关内容拉入上下文。
记住这句话:最便宜的 Token,是那些根本没进入上下文的 Token。
掌握启动服务等基础操作,减少不必要的 Token 消耗
以前我连启动个本地服务都要交给 AI,觉得“反正它能干”。后来发现这样做有两个坏处:一是浪费 Token,二是自己对项目越来越陌生。
现在的习惯是:启动服务、Git 提交推送、简单的文件操作,这些全都手动完成。一来不浪费 Token,二来自己也有参与感,慢慢也会更熟悉这些东西。
Git 提交我更建议手动操作。用小乌龟点几下鼠标就行,不用每次都让 AI 帮你执行一次 Git,白花花的 Token 还容易污染上下文。而且手动提交时你会注意敏感信息不要提交、node_modules 不要提交,这些 AI 有时候并不会帮你把关。
AI 生成的前端代码,务必在浏览器中实际验证
这是我自己踩过无数坑后总结出来的铁律。
AI 写前端特别容易“脑补成功”。它改完代码,跟你说“已经搞定了”,你看着代码好像没毛病。结果打开页面一看,布局错乱,按钮挤在一起,文字溢出。
所以做网页类任务时,一定要让 Codex 最后用浏览器验证。不管它说自己改得多完美,用 Browser Use 打开实际页面看一眼。没装这个插件的,建议装一个。
这个习惯让我省掉了无数次返工。
当 AI 陷入死角时,主动为其提供新思路
大模型也会钻牛角尖。