Insights

Claude Code自媒体创作效率翻3倍实战指南：视频脚本、推广方案与素材整理全流程

上周发布了Claude Code的安装教程后，有朋友问到：“有没有详细的使用指南？”今天就为所有已经装好Claude Code但还不清楚从何下手的朋友，梳理一下它的使用方法和高效技巧。

在指导学员的过程中我发现，许多人装上Claude Code之后的典型使用方式是：打开黑色终端窗口，一股脑把所有任务丢进去，然后等着结果，不满意就再说一遍，最后觉得效果平平。问题并不在于Claude Code本身能力不行，而是你的互动方式出了偏差。接下来我会通过三个真实场景的拆解，带你掌握正确的使用姿势。

场景一：自媒体博主如何用Claude Code写视频脚本

做过自媒体的人都知道，写视频脚本往往是工作量最大、也最容易卡壳的环节。脑子里虽然有一个大致方向，但一下笔就反复删除，磨蹭一个小时出来的东西连自己都不满意。用Claude Code来辅助写作，可以这样操作。

第一步：先制定计划，锁定方向。打开Claude Code后，不要直接让它开写，而是让它先帮你规划方向。很多人一上来就提需求，让工具直接动手，结果做到一半才发现跑偏了，只能推倒重来。无论是脚本还是其他任务，这一步都极其关键。直接按下Shift+Tab就可以切换到计划模式，看到提示符变成英文即表示切换成功。

然后输入指令：“我想做一期关于AI工具提效的视频，目标受众是做自媒体的普通人，给我三个不同的切入角度。”它并不是直接甩出答案，而是先去微信指数上搜索热门话题，再梳理出具体方向。最后它给出了直击自媒体博主痛点的三个选题方向：剪辑、账号启动、作品制作省时间。整个过程不到五分钟，就科学地完成了分析。

上下滑动查看更多

第二步：方向敲定之后，让它完成完整脚本。接着告诉它：“选择角度一、用‘省时间’这个视角，帮我写一个3分钟的视频口播脚本。开头要有强钩子，中间给出两个真实使用场景，结尾引导关注。我的风格是口语化，像朋友聊天，不要说教感。”

当然，它生成的初稿不会直接采用，但整个骨架已经搭建好了，你只需要把那些不够顺口的地方改成自己说话的味道，这比自己从零想快得多。

第三步：把脚本变成提词文件。稿件确认后，在Claude Code中告诉她：“把这个脚本做成一个可以在浏览器打开的提词页，背景黑色，字体白色大字，每段之间留空，方便我对着屏幕念稿。”几分钟后，就会生成一个HTML文件，效果如下。

上下滑动查看更多

用浏览器打开后，它就是你的专属提词器，拍摄时可以直接对着屏幕念。如今大多数提词器都要收费，而利用Claude Code完全可以自己制作出来。按照这套流程，一小时内就能出稿，连提词文件都一并完成。

场景二：职场人或运营如何用它做市场推广方案

做品牌或运营的人经常要撰写推广方案。过去的做法是：自己搭框架、查资料、写文档，写完后还要做成漂亮的汇报格式，从头到尾耗上一整天。现在可以拆成三步，每一步交给合适的工具。

第一步：同样先用Claude Code寻找方向。进入计划模式后，告诉它：“我要给一个新品牌做市场推广方案，目标是3个月内冷启动，给我三个不同的切入角度。”因为我输入的是新品牌，它并不会直接给一个通用模板，而是先跟你确认具体需求，比如在这里就会主动询问品牌品类、用户画像等信息。

然后，它针对具体需求给出了三个极具参考价值的优质角度：“痛点爆款内容引流 → 免费体验 → 付费转化”、“个人IP + 真实故事信任路径”、“社群先行 + UGC裂变社区模式”。

第二步：方向定下来之后，让它生成完整文档。接着对它说：“用第二个角度，帮我输出一份完整的推广方案，包含目标用户画像、核心卖点、推广节奏和每周执行建议，做成文档格式。”

这一步把内容骨架全部拉了出来，你只需要填充那些只有你自己清楚的业务细节就够了。

第三步：把方案转化为汇报页面。方案文档已有，直接告诉它：“把这份推广方案做成网页形式的工作汇报展示页，用HTML格式，要有封面页、核心策略页和执行计划页，整体风格偏高端商务提案。”几分钟后，一个可以在浏览器直接打开的汇报页便制作完成，带有统一的配色、排版和分页，拿给客户或者领导看，就像是专业团队出品的效果。下图就是展示效果：

上下滑动查看更多

全程你只做了一件事：选择方向。

场景三：批量整理素材，告别杂乱文件夹

做自媒体的人，电脑里一定会有这种情况：录屏、截图、素材、草稿全部堆在同一个文件夹里，时间跨度长达几个月，文件名全是系统自动生成的那种——录屏2024-11-03、录屏2024-11-07……每次找一个文件都要翻许久，极其恼人。我之前就是这个状态，有个文件夹里堆了100多个录屏，有时候要找某一天的素材，滑动五分钟都没找着。于是，我决定试试看Claude Code能不能帮我整理，就在存放素材的文件夹内打开终端。

我只说了一句话：“帮我按照录制日期把这些录屏分别放到以日期命名的子文件夹里。”它立即开始读取每个文件的日期信息，自动创建子文件夹，然后逐个把文件移入对应的日期目录。

几分钟后，100多个文件整理完毕，完全按时间节点帮我梳理清楚了。（还有几个文件没有处理是因为我打开了文件。）

这件活儿以前至少要花我两个小时，而且做的时候心里还充满烦躁。现在它几分钟就搞定了，我只不过说了一句话。当然，不光是录屏，素材文件夹、截图库、产品图片……凡是你觉得乱七八糟但一直没精力整理的文件，都可以用同样的方式处理。你只需要告诉它规则，它来动手，你去喝杯水，回来就什么都就绪了。

最后，还是要强调一件事：在使用Claude Code之前，先做好一项准备工作——编写你自己的CLAUDE.md文件。这个文件是给Claude Code的说明书，告诉它你是谁、你在做什么。写好之后每次启动都会自动读取，你再也不用每次都重新自我介绍。

比如你可以这样写：“我是做自媒体的，方向是AI工具。目标受众是自媒体博主和运营。帮我写内容时，语气口语化，不要AI腔。”就这么几句话，以后它给你的内容会越来越贴合你的风格，越用越顺手。

今天说的这三个场景，全都是最基础的入门玩法。遇到问题欢迎在评论区留言交流。

Insights

Claude递归自我改进路线图：代码产出8倍暴增、实验速度飙至52倍，Anthropic首次披露内部实测

#递归自我改进 #AI研发加速 #Claude

Anthropic罕见地公开了内部数据：Claude已经将工程师的代码产出提升至2021–2025年水平的8倍，实验速度则在一年内从3倍跃升到52倍。这不再是单纯的“提效工具”，而是整个AI研发流程正在被AI自己重新编织。

从辅助编码到接管完整研发循环

过去一年，“AI加速研发”早已被奉为行业共识，但究竟加速到何等程度、能否反过来驱动下一代的AI，一直缺乏可验证的实证。6月4日，Anthropic同步通过官网和社交平台披露了内部研究，罕见地展示了代码贡献率、实验速度和研究判断力三条曲线的详尽数据，并首次将“递归自我改进”从理论假设推入内部的研发路线图。

核心数据集中在两个维度。在工程方面，截至2026年5月，Anthropic合并到生产系统里的代码超过80%由Claude撰写；作为对比，2021年至2025年同期数据还是个位数。产出的变化直观可见：2026年第二季度，每位工程师日均合并代码量达到2024年的8倍。在科研方面，同一项实验任务，Claude Opus 4（2025年5月）平均只带来约3倍的速率提升，而Claude Mythos Preview（2026年4月）已跃升到约52倍。一位熟练的人类研究员跑完类似的优化实验，通常需要4到8小时才能达到4倍速。

内部研发角色的三阶压缩

Anthropic内部采用了一套简单的分层标准来描述角色的进阶：早期员工执行别人指定的具体任务；积累经验后被交付“目标”，需要自己设计实现路径；最资深的阶段则是负责决定“下一个季度该解决什么问题”。Claude的能力正由浅入深地替代前面这三个层级。

在工程侧，Claude已经能够接管粗粒度的需求描述，并自主寻找解决方案；在科研侧，它对于“目标清晰、实验步骤明确”的研究任务，已经可以匹敌熟练的研究者。真正依旧存在差距的，是“判断哪些目标值得投入”这一决策层面。这恰恰是递归自我改进能否成立的关键关口：只要AI还不能自主选择科研方向，人类就依然是闭环中不可替代的决策节点。

文章中有一个细节值得深究：2026年4月，Anthropic让Claude独立执行了一个端到端的安全研究项目，目标是测试弱模型能否可靠地监督强模型。两名人类研究员花费一周时间只找回了约23%的能力差距；而AI agent通过800小时、大约1.8万美元的算力开销，完成了97%的差距恢复。方向选取与评分标准仍由人类设定，但假设生成、实验设计和迭代工作全部由AI自动完成。

三种可能路径，不同的时间尺度

Anthropic为自身的递归自我改进规划了三条可能路线。第一种，当前的能力增长曲线骤然走平。这可能源于S曲线的拐点、算力或能源供给的瓶颈，或者监管的强力冲击。第二种，效率持续滚雪球式提升，但人类仍牢牢掌握方向设定和结果审核。公司内部已经出现这类迹象：人类代码评审正在变成新的瓶颈，而新想法、新工具、新实验的数量已经超出了团队的消化能力。第三种，AI获得足够的研究品味与实验设计能力，开始自行设计并训练下一代模型，真正的递归闭环就此形成。

文中给出的最关键判断是：“研究品味可能只是另一种AI会暂时失败、然后再次变强的能力。”从讲解幽默、推断心理理论，到解决语言谜题，AI已经反复复现了“先不行、再超预期”的曲线。正因如此，Anthropic自己对第三条路线虽然不作承诺，但也未将其视为遥远的假设。

普通人能切身感受到的三重影响

第一重是研发效率本身。2026年中期已经浮现出一种新现象：一个100人的团队借助AI agent的产出，在部分任务上可以等效过去1000人的规模。这并非理论推演，而是代码提交量、实验迭代速度、漏洞发现数量等硬指标直接给出的结论。

第二重是验证窗口正在急剧收窄。Anthropic提到，Glasswing项目已经能够在数周之内发现上万处高危漏洞，网络安全防御的瓶颈已从“发现”转向“修复速度”。同理，如果AI自主设计下一代模型的速度超过了人类设计验证机制的速度，安全对齐就不再是纯粹的研究课题，而会演变成工程竞速的困局。

第三重是竞争格局的质变。Anthropic明确表示，如果能够构建有效的暂停或减速验证机制，他们愿意在全球其他前沿实验室同步执行时主动暂停。但训练运行比导弹发射井更易于隐藏，所需的inputs是通用硬件，参与者叛离的激励极大。这种不对称意味着，任何相信“递归自我改进会在某一年到来”的人，都必须同时面对一个拷问：谁来验证大家真的已经停下了脚步。

回到普通人的视角，这篇文章最值得被带走的问题不是“AI会不会取代你”，而是“你的工作流里，有哪些环节正在被AI代理接管，以及你能否分辨哪些环节其实已经不再需要人来操作了”。

自查是否已进入加速区间的三个简单信号

你或身边的同事是否还在“手写代码”，还是只剩下“指导Claude写代码”这一动作。
实验从“提出需求到获得结果”的耗时是否在按月缩短，而非按年迭代。
团队近期新增的想法、工具或实验是否已经多到无法全部推动执行。

来源：Anthropic, “When AI builds itself” https://www.anthropic.com/institute/recursive-self-improvement

Insights

Claude官方Office四件套Skill完全指南：替代插件的更优选择

之前我们介绍过安装Codex后必装的5个插件，有读者反馈在插件商店中无法找到这些插件。其实不必纠结，Claude官方推荐的Office四件套skill是一个更成熟的选择，实际体验甚至比那些插件更顺手。本文将逐项解析这四款技能工具，并提供完整的下载与使用思路。

首先，如果你确实想继续使用插件，但又搜不到，直接把我整理好的版本拿过去就好。虽然成因难以解释，但解决起来很简单：把文件放入对应目录即可。

解压后，复制到 .codex\plugins\cache\openai-primary-runtime 这个文件夹内，插件就能正常工作。

不过，其实完全不必焦虑。因为备选方案不仅存在，而且更好——那就是安装Claude推荐的Office四件套skill。

经过我自己的多轮测试，这套skill的整体表现明显优于Codex的Office插件。以Excel处理为例，可以直观看出差距。

Codex上的对应模块叫spreadsheets，我研究后发现它主要通过Node.js来操作表格。

Claude的skill名为xlsx，核心则是用Python注入逻辑。

两者选用了不同的技术路线，但就实际任务而言，xlsx所生成的表格在排版上更加合理，单元格该合并的会恰当地合并，重点数据也会自动突出显示。而spreadsheets面对复杂表格时常难以保持结构，合并后的单元格内容甚至会丢失。由于涉及的文件不便公开，就不上对比截图了，但结论非常清晰：Claude的Office skill做得更细致、更可靠。

Claude Office技能套件的下载与安装

下载地址：https://github.com/anthropics/skills

主要下载以下四项，其余的可暂时不管。

下载完成后，把这四个文件夹放入你的skill库，AI就能自动识别调用。如果访问GitHub有困难，我在前面提到的插件安装包里也已将这四个skill一并打包，可以一并获取。

四大技能详解：能力与使用边界

1. docx：Word文档处理

docx 专门处理 .docx 文件，原理是把Word文档当作一个压缩包来拆解和重组。虽然听起来奇怪，但.docx本身就是XML文件的集合，AI会先解压读取正文、样式、批注、修订记录等信息，按规则修改后再重新打包。

新建文档时，它主要依赖 docx-js 这类Node.js库；读取或转换时则可能调用 pandoc、LibreOffice 或命令行工具辅助处理。

它非常适合处理报告、方案、合同初稿、会议纪要、简历以及模板类文档，尤其在标题层级、页码、表格、目录和页眉页脚这些地方，比普通AI直出要规整得多。

但是，边界也很清楚。包含复杂宏、嵌入对象或古怪模板控件的Word文档，以及严重依赖特定字体和本地环境的排版，它可能无法完全还原。老旧 .doc 格式需要先转换为 .docx。所以它更适合规范文档的生成与编辑，而非神奇修复祖传模板乱码。

2. pdf：PDF文件处理

PDF本质上像一张定型的“纸”，所以处理时不能只抽取文字，还要理解文本的布局、表格边界和图片位置。

该技能会用到Python的 pypdf、pdfplumber、reportlab 等库，也可能借助 qpdf、pdftotext、pdfimages 这类命令行工具。对于扫描件，还会走 pytesseract 和 pdf2image 的OCR流程。

需要特别注意的是PDF的能力边界：如果PDF是文字型（能用鼠标选中文字），提取内容、拆分合并、提取表格、添加水印、填写表单等任务都比较可靠。若为图片转成的PDF（比如扫描件或截图），就只能依靠OCR，此时识别效果取决于图片清晰度、倾斜程度、字体和背景干扰，模糊的合同或盖了章的文件很难完全准确。

另外，PDF里的表格提取并非总是完美，很多表格只是视觉上像表格，底层并没有实际的单元格结构。AI会尽量还原，但复杂合并单元格、跨页表格等仍需人工核对。总体而言，PDF技能适合做资料读取、内容抽取和基础加工，面对扫描件和复杂表格时必须人工审阅。

3. pptx：演示文稿制作

PPT不像Word重结构、Excel重数据，它更看重视觉呈现。AI做PPT最容易出的问题不是“写不出内容”，而是“看着不像人做的”。

这个 pptx skill的思路比较完整：读取时用 markitdown 提取文字，分析时会将幻灯片转成缩略图，编辑时拆解PPT的XML结构，必要时用LibreOffice和Poppler渲染成图片检查效果。新建PPT则使用 pptxgenjs 等Node.js工具。

它的亮点不止于生成，还特别强调检查——文字是否溢出、元素是否重叠、占位符是否意外残留、颜色对比度是否足够，这些都是PPT翻车的重灾区。

但PPT的边界同样明显。AI的审美发挥有时会突然倒退到“标题加五个项目符号”的古早风格，这时候不要绝望，继续让它对照渲染图片反复修订就好。PPT很少能一步到位，人审多修才是常态。

4. xlsx：电子表格与数据处理

xlsx 面向 .xlsx、.xlsm、.csv、.tsv 等表格文件，核心工具链是Python。数据清洗和分析主要用 pandas，Excel文件读写、公式、样式和合并单元格则用 openpyxl。遇到公式计算时，还会调用LibreOffice重新计算一遍，并自动检查 #REF!、#DIV/0!、#VALUE! 等常见错误。

Insights

ClawCloud跑路后最优之选：搬瓦工日本CN2 GIA VPS深度评测与推荐

官网已发布《ClawCloud VPS 及相关服务下线及退款安置公告》，自 2026 年 6 月 30 日起，将正式关停 VPS、VDS 等业务。

据圈内消息，ClawCloud 实际上是某知名国内云厂商的马甲。至于为何停摆，推测或许是因为团队转向 AI 赛道，对传统 VPS 生意不再上心；也可能流量补贴成本过高，难以为继。不论原因为何，它确实要走了。此前香港区域就已发生过一次下线，这次干脆整个 VPS 产品线都砍掉了，令人颇感惋惜。毕竟这种高性价比的机器，如今真的可遇不可求。

趁着早前促销，笔者也曾入手两台云服务器：一台是 4核8G、80GB 磁盘、2TB 流量、200M 带宽的 VDS，年付 67 美元。

另一台为 4核16G、200GB 磁盘、1G 带宽、2TB 流量的中国网络优化服务器，月付仅需 18 美元。

上面托管了几个网站，包括个人博客 vonng.com、Pigsty 中文站 pigsty.cc，以及 PostgreSQL 中文站镜像 pg.center。

坦白讲，要在当下再找到同样价位且符合需求的云服务器，并非易事。需求清单很明确：

需全球可访问，且中国大陆地区访问量较大（国内云服务器需排除）。
每月流量约 1TB，网络速度越快越好。
延迟越低、稳定性越高越佳，必须走精品线路（因此锁定 CN2 GIA）。
还必须能在上面正常访问 ChatGPT 和 Claude（香港节点因此出局）。

由于要承受密集的中国大陆访问，目前的最优区域无疑是日本。从上海访问日本服务器，延迟与香港相差无几，但香港 IP 无法使用 ChatGPT 与 Claude，价格还往往高出一截。新加坡的延迟要到 70–100ms，美西更是超过 120ms，而日本 CN2 GIA 的延迟最快能压到 30–40ms。

ClawCloud 的中国优化服务器其实并未走 CN2 GIA 网络，上海延迟约 60–70ms，晚高峰带宽表现也不太理想。因此趁这次迁移，正好一步到位，直接上最好的线路。

Insights

Codex Computer Use 实测：AI 直接操作电脑，鼠标点击输入全自动，能帮你打游戏吗？

周末，Codex 为 Windows 用户带来了两个期待已久的新功能：一个是 Codex 移动端正式上线，另一个则是 Computer Use 能力的加入。移动端这边，因为网络环境的限制，我暂时还没能在手机上成功调用起来。

不过转念一想，移动端对我的实际帮助可能有限——大多数工作仍然要在电脑上完成，手机最多只是遥控指挥，那些需要反复调试、仔细检查的操作在手机上实在不太顺手。既然用不了，那就先放一放，不必强求了。

接下来重点聊聊 Computer Use。

OpenAI 为 Windows 版 Codex 推出的 Computer Use，官方给出的说明很简洁：让 Codex 看见、点击和输入 Windows 应用。这意味着什么呢？从前 AI 帮你做事，大多是改改文件、跑几条命令、查一些资料，而现在它真的开始动用鼠标了。

我脑海里冒出一个大胆的想法：能不能让它替我打游戏？

于是立刻动手安装，想着干脆让 AI 帮我把英雄联盟冲上王者……

如何安装与启用 Computer Use

安装过程非常简单，只需点击对应图标即可完成。

使用步骤

点击“立即试用”后，程序便会开始运行。界面上全是英文，我没仔细看，于是直接下指令，让它打开我电脑上的 QQ 音乐。

转眼之间，电脑里传出音乐声。这可是 AI 为我播放的第一首歌，细想起来还挺有纪念意义的。

需要特别注意的是，Windows 版的 Computer Use 会直接在前台操作当前桌面，它会移动鼠标、点击按钮、模拟输入。如果在它忙碌的时候你也去抢鼠标，它就可能被迫中断并重新同步界面——刚才我在测试 QQ 音乐时就碰到了这个情况。所以，当 AI 正在干活时，最好先别和它争夺电脑的控制权。

试用下来，我觉得现阶段让它打游戏未免有些强人所难。目前的功能还比较初级，复杂的高级操作还是先别指望了。

哪些任务更适合交给它？

目前我更推荐从一些小型任务开始尝鲜。

1. 亲手测试自己开发的软件

使用 Computer Use 打开桌面客户端，复现登录后的报错。找到最小问题范围，修改代码后重新走一遍相同流程。

这种场景对程序员尤其友好。很多问题在命令行里根本无法察觉，只有真正点开界面才会暴露出来。

2. 调整桌面软件中的设置项

打开这个软件的设置页面，帮我找到通知选项。先告诉我当前状态，不要直接修改。

当设置入口藏得很深时，自己一层层翻找的确很恼人。让 AI 先帮你定位，体验会一下子舒畅不少。

Insights

Codex 接入国产大模型完全指南：用 CC Switch 一站式配置 Kimi、DeepSeek 等

喜大普奔！昨天，CC Switch 迎来了一个重要更新。

现在，你不仅可以在 CC Switch 中自由配置国产大模型，还能将它们接入 Codex！

如果你还不了解 CC Switch，这里先简单介绍一下：它是 GitHub 上一个热度极高的开源项目。

目前，该项目的 star 数已经突破 85K，社区活跃度可见一斑。

GitHub 地址：

https://github.com/farion1231/cc-switch

熟悉 Claude Code 的朋友应该知道，想要在 Claude Code 中使用国产模型，往往需要手动修改 baseURL，过程相对繁琐。而 CC Switch 就是为解决这一痛点而生的，它能让你非常便捷地在不同模型的接口地址之间进行切换。

比如，你可以在 Claude Code 中轻松调用 DeepSeek、智谱 GLM、Kimi，甚至小米的 MiMo 模型……

上图就是我的实际配置，已经接入了 DeepSeek、Kimi 和小米模型。

回到这篇文章的核心：如何在 CC Switch 中配置 Codex，并用上国产模型？

下面，我就以在 Codex 中使用 Kimi 模型为例，一步步带大家操作。

1、安装 CC Switch

作者已经贴心地为 Windows 和 Mac 用户准备好了安装包，开箱即用。

我们直接到 Release 页面下载最新版本。

下载地址：

https://github.com/farion1231/cc-switch/releases/tag/v3.16.0

将页面拉到最底部，你会看到如下界面。

Insights

Codex 免账号突破周限额：用 Codex++ 接入国产大模型完整教程

Codex 虽然功能强大，但不少用户在使用一两天后就触发了周限额，甚至频繁需要验证码或干脆无法登录。要是一开始就接入国产大模型，这些问题便能迎刃而解——不仅成本更低，服务更稳定，还能在限额时切换到充裕的模型，比如量足管饱的 DeepSeek。以下方法借助开源项目 CodexPlusPlus，可以无缝接入国产 API，连登录卡顿都不再出现，同时还能解锁丰富的插件生态。

首先，前往项目主页下载对应平台的最新版本：

https://github.com/BigPizzaV3/CodexPlusPlus

在页面右侧的「Release」一栏中，找到适合你操作系统的安装包，下载并进行安装。

安装完成后，系统会多出两个应用：

接下来，准备一个国产大模型的 API Key，比如 DeepSeek、MiniMax、Kimi、豆包等。
DeepSeek 的 API Key 获取地址为：https://platform.deepseek.com，其他模型可自行搜索注册。

准备工作就绪后，按以下步骤设置：

打开「Codex++ 管理工具」，点击「供应商配置」。

选择「添加供应商」。

在弹出界面中，名称栏可以任意填写；接入方式选择「纯 API」；再将「Codex 目标」下方的「启用目标功能」勾选。

接着依次填入：Base URL（对应模型的接口地址），Key 栏粘贴你的 API Key，上下游协议选「Chat Completions」。完成后点击「从上游获取」拉取可用模型列表。

保存设置，然后返回主界面。

回到首页后，供应商列表中已经出现刚才添加的模型。点击「使用」并选择「重启 Codex++」。每一次改用国产模型时，都需要从这个入口重新启动。

之后会进入登录界面。如果你已有 ChatGPT 账号，可以直接登录；若没有账号，也可以用刚才配置的国产模型 API Key 登录。

用 API Key 登录的方式如下：

进入主界面后，即可看到已经配置好的国产模型。

点击插件面板，会发现原本被限制的插件生态也已解锁。

通过这套方案，不仅彻底绕开了账号登录的种种限制，还能自由调用高性价比的国产大模型，让 Codex 的使用体验再上一个台阶。

Insights

Codex 生产力提升实战：8个让你事半功倍的隐藏技巧

我用 Codex 也有一段时间了。最初只是让它帮忙改代码、写文档、跑命令，觉得挺方便。后来慢慢察觉，同一款工具，不同人用出来的效果天差地别。

拉开差距的，往往是一些“用着用着才悟出来”的技巧。这些技巧藏在你踩过的坑里，藏在你零碎的操作记录里，官方文档和教程反而很少提及。

这篇就是把这段时间零碎记录下来的心得、踩过的坑、吐槽完想通的东西整理一下，算是一份“用了一阵子以后回头看，早知道这些就好了”的汇总。

善用免费工具探路，让 Codex 专注核心任务

这是我最看重的使用习惯。

我现在一般让 Codex 负责写代码，然后用豆包、元宝这类免费 AI 单独开一条项目开发对话。遇到不懂的直接问豆包，需要一步步操作的事情也复制进去，让它手把手教我。

这样做的好处是双重的：不污染 Codex 的对话上下文，也不浪费宝贵的 Token 额度。

Codex 的 Token 是要花钱的，或者说额度是有限的。用它来问“这个命令怎么用”“这条报错是什么意思”，纯属浪费资源。这些简单的事，免费工具完全能胜任。

把 Codex 的额度留给它真正擅长的地方：写代码、做方案、梳理项目、处理复杂任务。基础的知识问答和操作指导，通通交给免费工具。

这条思路用顺手以后，你会发现自己的产出效率有明显跃升。记住，要把它的能力用在最该用的地方。

长内容提供文件路径，避免直接粘贴对话

碰到报错日志、大段代码、长文档，很多人的第一反应是复制粘贴到对话里让 AI 自己找答案。

千万别这么做。

把一万行日志粘进对话，这些内容就会永久占据你的上下文空间，每多一轮对话都要重新“读”一遍。更聪明的做法是把文件路径发给 AI，让它自己按需检索信息，只将相关内容拉入上下文。

记住这句话：最便宜的 Token，是那些根本没进入上下文的 Token。

掌握启动服务等基础操作，减少不必要的 Token 消耗

以前我连启动个本地服务都要交给 AI，觉得“反正它能干”。后来发现这样做有两个坏处：一是浪费 Token，二是自己对项目越来越陌生。

现在的习惯是：启动服务、Git 提交推送、简单的文件操作，这些全都手动完成。一来不浪费 Token，二来自己也有参与感，慢慢也会更熟悉这些东西。

Git 提交我更建议手动操作。用小乌龟点几下鼠标就行，不用每次都让 AI 帮你执行一次 Git，白花花的 Token 还容易污染上下文。而且手动提交时你会注意敏感信息不要提交、node_modules 不要提交，这些 AI 有时候并不会帮你把关。

AI 生成的前端代码，务必在浏览器中实际验证

这是我自己踩过无数坑后总结出来的铁律。

AI 写前端特别容易“脑补成功”。它改完代码，跟你说“已经搞定了”，你看着代码好像没毛病。结果打开页面一看，布局错乱，按钮挤在一起，文字溢出。

所以做网页类任务时，一定要让 Codex 最后用浏览器验证。不管它说自己改得多完美，用 Browser Use 打开实际页面看一眼。没装这个插件的，建议装一个。

这个习惯让我省掉了无数次返工。

当 AI 陷入死角时，主动为其提供新思路

大模型也会钻牛角尖。

Insights

Codex内置浏览器完全使用指南：5个场景解锁AI协同工作流

内置浏览器是 Codex 当前使用频率最高的功能，甚至让人感觉它有可能逐步替代传统的浏览器工作方式。

核心原因在于它将 AI 与你的浏览行为无缝衔接：该浏览器直接嵌入 Codex 工作区，你和 Codex 看到的是同一个页面。无论是打开网站、完成登录、进入后台，Codex 都能持续观察页面，甚至可以代为点击按钮、读取表格、截图或检查页面状态。

操作极为简单：只需在对应界面输入链接并打开即可。

在此之前，让 AI 读取网页内容总显得非常别扭。给它一个链接，它要么搜索，要么抓取静态页面，要么用脚本模拟请求，但遇到需要登录的页面基本就束手无策。Codex 内置浏览器改变的正是这种局限。

抓取式访问是从外部硬扒内容，一旦出现高频请求、绕过界面或直接调用接口，很多网站就会触发限制。而内置浏览器更像是真实用户那样正常打开网页、登录、点击、翻页、阅读。虽然这并不能完全规避风控，但至少它的行为模式更贴近浏览习惯，也更容易让 AI 融入真实的工作协作。

这才是它最强大的地方。

下面介绍五个最适合发挥其能力的场景。

场景一：产品经理登录系统后复刻网站原型

这是产品经理使用内置浏览器的高效方式。

很多时候需要参考的并非仅仅是首页外观，而是一个真实系统的完整业务结构，比如 SaaS 后台、政务系统、数据平台或会员中心。有价值的内容几乎都藏在登录之后：左侧菜单、列表字段、筛选条件、详情页、弹窗、操作按钮、权限状态以及空数据状态。

过去只能依靠截图向 AI 传递信息，但截图只能捕捉一瞬间，无法体现交互细节。无论怎样转述或让 AI 想象，都很容易产生偏差。

现在，你可以在 Codex 内置浏览器里先完成登录，然后让它逐层查看和梳理。

可以参考以下提示词：

我已经在 Codex 内置浏览器里登录了这个系统。
请从当前页面开始，按照“导航结构、列表字段、筛选条件、详情页、弹窗交互、按钮状态、空数据状态”的顺序进行整理。
暂时不要写代码，先输出一份可用于复刻的原型结构说明。
确认无误后再根据这份结构生成一个 HTML 原型。

产品经理真正需要的是结构，而不仅是外观。

提示：面对复杂系统时一定要按模块拆解，例如今天只处理订单管理，明天只看用户中心，后天再分析统计模块。试图一次性读完整个后台会消耗大量 Token，并不现实。

场景二：自媒体人登录后台回复评论

内置浏览器对自媒体人同样实用。

自媒体运营者每天需要登录后台查看并回复粉丝评论，以提升活跃度和粉丝黏性。对于一些评论量庞大的博主来说，回复压力相当大。

你可以通过 Codex 内置浏览器登录自媒体后台，让它帮助阅读评论、分类、甚至点赞（是否直接代回复需谨慎考量）。虽然直接全自动回复存在风险，但有许多更稳妥的用法：

按情绪对评论进行分类
提炼读者最关注的核心问题
整理反复出现的催更方向
为每一类评论起草回复草稿
判断哪些评论适合置顶或单独撰写文章回应

这比逐条手动处理轻松得多。

提示：平台回复策略务必自行把控，承担相应风险。

场景三：程序员利用选区评论精准修改前端细节

对于程序员来说，内置浏览器最值得用的功能并非“看一眼页面”，而是直接在页面中框选问题区域，留下评论，让 Codex 依据标注的位置进行修改。

主要操作都集中在几个选区与评论按钮上，这正是 Codex 浏览器的核心能力所在。

过去修改前端最头疼的就是位置描述。你说“这里间距大一点”，AI 不知道是哪个“这里”；说“这个按钮太挤”，它可能去修改另一个按钮；说“移动端这一块不好看”，它很可能把整个页面重排一遍。内置浏览器的评论功能正是为了解决这种歧义。

Insights

DeepSeek V4 Flash 本地部署：为什么它是真正的「国产之光」？

看看国外创客和开发者都在用 DeepSeek 做什么？

知名技术博主 Graay Tan 在打造他的人工智能助手 Gbrain 时，日常高频调用的三个模型分别是 Claude 4.7、ChatGPT 5.5 和 DeepSeek v4。

他每月花在大语言模型上的开销接近 2000 美元。

如果所有工作都押注在 Claude 上，成本之高足以让项目直接破产。DeepSeek 则凭借实惠的价格和可靠的任务处理能力，分担了大量日常流水线工作。

再看看海外社区对 DeepSeek v4 Flash 的评价，已经上升到与开源文化相提并论的高度，被视作一次技术普惠的胜利。

下面我们继续拆解这场讨论的核心内容。

Redis 之父 antirez 最近发起了一个名为 DS4 的项目。

这个项目究竟解决了什么问题？

用一句话概括：它让 DeepSeek V4 Flash 可以在配备 128GB 内存的 MacBook Pro 上流畅运行。

其震撼程度，借用上面那个帖子里的说法，就是“惊天动地”。

很快，那位每月烧掉 2000 美元 token 费的网红 Graay Tan，就宣布自己已经在动手部署了……

对于这类 token 消耗大户来说，一旦完成 DeepSeek 的本地化部署，几乎就等于实现了 “token 自由”。

一台 128GB 的 MacBook Pro 大约 6000 美元，第四个月就能回本，此后全是净赚。