Insights

AI WorkBuddy 10个实战Prompt模板，高效解决80%日常工作

最近陆续有朋友私信问我：“这个系列还在更新吗？”答案是：当然，而且会一直做下去。如今 AI WorkBuddy 已经融入我的日常工作，成了离不开的高效伙伴。阅读量并不是我关心的重点，只要这些从真实场景中浓缩出来的经验能给各位的工作带来一点提升，分享本身就有了十足的意义。

今天就把我每天都用得上的 10 个 Prompt 模板摆出来，都是实战打磨后的干货，复制即用。

模板 1：周报轻松写，五分钟就搞定

场景： 每周五那件让人皱眉的事，有了它你就能避开流水账，五分钟收工。

Prompt：

  我是一名[你的职位]，这周主要完成了以下工作：  
  
1. [事项一]  
2. [事项二]  
3. [事项三]  
  
请帮我写一份工作周报，要求：  
  
- 字数控制在 200 字左右  
- 语气正式但不生硬  
- 重点突出完成情况和带来的价值，少说繁琐的过程

体验心得：
你只需要填入几个关键点，AI 给出的周报结构清楚、重点分明。我通常稍微顺两句就能直接发出，周五的摸鱼时间一下子多了起来。

模板 2：文字抛光，改得像资深编辑出手

场景： 写完一段话总感觉哪里拧巴，读起来不顺畅，又不知道从哪儿改起。

Prompt：

  你是一位拥有 10 年经验的资深编辑，擅长把文字改得简洁、有力、且富有画面感。  
  
请帮我修改以下这段文字，要求：  
  
- 严格保留原意，不改变核心观点  
- 删掉废话和冗余词汇，让每句话都有存在的价值  
- 语气要更自然，像是在与人面对面交流  
  
原文：  
[粘贴你的文字]

体验心得：
比简单说一句“帮我改文章”强上十倍。把角色设定为“10 年经验编辑”，并给出具体的打磨方向，AI 就能精准地帮你把文字琢得更专业。

模板 3：长文一眼抓重点，3 秒看透核心

场景： 面对动辄万字的报告或者行业长文，时间又紧，没法细读，只想快速抓到核心。

Prompt：

  请帮我总结以下内容，要求：  
  
- 用 5 句话以内说清楚文章的核心观点  
- 如果文中有关键数据或重要结论，请重点保留  
- 最后加一句分析：这篇内容对[你的职业/业务]最有参考价值的点是什么  
  
内容：  
[粘贴文章全文]

体验心得：
篇幅再长的报告都能秒变精要。最让人惊喜的是最后那句针对性解读——它不是冷冰冰的概括，而是站到我的身份上给出分析，非常贴心。

Insights

AI热点Skill免费开放，让Agent随时随地抓取最新AI动态

就在昨天，我将自己搭建的 AI 热点监控站点——AIHOT，正式向所有人免费开放。短短一天内，访问用户就突破了 10 万 UV，页面浏览量更是超过 60 万 PV，几乎没有任何差评或故障反馈。看到这份数据，我总算长长地松了一口气。

首日反馈中，呼声最高的需求之一是“深色模式太刺眼，能否增加浅色模式”。这确实是我的疏忽，在昨天上午花了一个多小时紧急开发，中午便已上线了浅色主题。

另一大需求则是希望提供 Skill、API 和 RSS 接口。

同时一位关注者也在催促，那必须立即安排上。

毕竟身处 AI 时代，只靠一个 Web 网站的形式实在太笨拙了。于是下班后我接着打开 AI 编码工具，准备把大家提出的功能全部补齐。经过一个通宵的奋战，所有开发工作宣告完成。

今天，我也决定将 AIHOT 的能力开放给所有使用 Agent 的用户，同样是完全免费。

网址在这里：https://aihot.virxact.com

进入 AIHOT 主站后，点击左侧的“Agent 接入”，就可以看到全部选项。

目前开放了三种接入方式：Skill、RSS 和 API，分别对应不同场景的需求。我把自己认为适合对外开放的数据，也都做了最大限度的公开。

核心能力：AIHOT Skill

Skill 是呼声最高的模块，也是 AI 时代最关键的要素之一。Skill 本质上是提供给 Agent 使用的技能包，如果你不太清楚，可以搜索我过往关于 Skills 的详细介绍。你可以在任何支持 Skill 协议的 Agent 上使用，比如 Claude Code、Codex、OpenCode、OpenClaw、Hermers 等。

AIHOT Skill 的核心作用很简单：让你的 Agent 直接读取 AIHOT 网站的部分数据，从而无缝嵌入到你的日常工作流中。

安装方式非常直接，只需一句话，因为我已经把 Skill 部署在了自己的服务器上，无需特殊网络环境：

Insights

AI热点监控工具AIHOT免费开放｜我三年自媒体信息筛选经验全公开

今天，我决定把那个一直陪伴我、帮我追踪AI前沿动态、辅助选题决策的私用网站，正式面向所有人免费开放。

它几乎凝结了我做AI自媒体三年以来，所有关于信息获取的心得与经验。

我把它叫做：AIHOT。

很多朋友可能在过去的文章里，已经见过它的身影。

这个工具的功能说起来非常简单，一段话就能讲清：

它帮你以清晰的时间线，持续监控全球范围内与AI相关的所有信息，再通过我亲手打磨的筛选策略，把那些真正值得关注的内容提炼出来。本质上，它就是对信息海洋做了一次深度降噪，帮我们守住本就稀缺的注意力。

这个网站最初是为公司内部服务的，设计它的本心，就是想保护好我自己的创作精力。坦白说，一开始我完全没打算对外公开。

因为对于一个自媒体人而言，信息的时效性和独特性，有时就是安身立命的根本。

但，或许还是产品人的那股执念在作祟吧。我工作这些年来，一直在画原型、做产品，做了很多年。

我心里始终存着一个产品梦，还是想为这个美好的互联网留下一点自己的痕迹。而我最大的成就感来源，无非就是大家喜欢看我的文章，愿意用我做出的东西。

在每篇文章的末尾，我总会写一句：“谢谢你看我的文章。”

这句话，出自我最爱的一部电影——《头号玩家》。

那是绿洲的缔造者哈利迪在最后消散时，对身为玩家的主角说的告别语，也是我心目中全片最动人的一笔。

我也希望自己创造的东西，能被人看见，被人喜爱，仅此而已。

于是，在四月初的某个深夜，连说服自己的过程都没有，突然就动了念头：不如就开放给大家吧，让更多人可以一起使用。

如果它真的能帮到你们，那我会由衷地感到开心。

网站地址在这里：https://aihot.virxact.com/

因为确实没什么预算去买专门域名，所以用的是公司域名进行开发，可能网址会有点难记，还请见谅。

接下来，我想花一些篇幅，好好介绍一下这个产品，以及在我开发过程中踩过的坑和积累的经验。

先聊聊 AIHOT 这个产品本身。

在我看来，这个时代，很多工作已经不再是单纯的执行——执行部分，AI Agent已经能做得相当出色。现在，更多的工作重心落在了信息处理上，我个人习惯将它拆解为三个环节：

获取信息 → 对信息进行分析 → 基于信息做出决策。

对于内容创作而言，“获取信息”就是从信息汪洋中找到值得关注的线索；“分析”则是基于这些线索，看看有什么选题角度可以切入；而最后的“决策”，就是判断这个选题到底值不值得动笔。

目前，AIHOT主要解决的就是“获取信息”这个环节的问题，这也是我过去最大的痛点。如今的世界早已是信息洪流，尤其是在AI时代，垃圾信息铺天盖地。为了保护注意力，我们必须对信息做严格的筛选。

而且，在AI时代的信息黑暗森林法则之下，信源比信息本身更重要。

所以，第一步，必定是筛选信源。

PS：这里我需要非常坦诚地说明一下，上方的截图是带有内部同事权限的AIHOT界面。公司同事和我们MCN签约博主通过企业飞书认证登录后，能看到更多功能。而大家看到的是下面这个无法登录的公开版本，在标签页上会精简很多，许多底层的策略和信息是不对外展示的。这一点目前确实没办法公开，还望大家理解，真的非常抱歉。

说回信源的部分。

我目前持续监控的信源共有168个，监控手段比较多样：有RSS订阅、有直接解析对方HTML抓取、有调用对方公开的API接口，也有我自己花钱采购的第三方数据接口等等。

每一个信源，都是我亲手逐一筛选过的，秉持着宁缺毋滥和一手信息优先的原则。这个过程大概调优了一个月，真的是靠日积月累慢慢填起来的。

信源等级我自己划分为三类，这和后续的精选策略权重直接挂钩，分别是T1、T1.5和T2。

比如OpenAI的官方博客、Anthropic的工程博客、奥特曼的个人Blog、CMU的博客等等，这些都是最值得关注的官方一手信息，也就是T1。

而这些官方机构的X账号，通常发布的内容比官方网站更多更杂，无用信息的比例也更高，所以我将它们定为T1.5，权重会略低一些。比如OpenAI的官推。

其他所有：技术大佬的个人号（比如奥特曼、达里奥等）、KOL、各类媒体、综合资讯站点，则统一归入T2。

信源挑选完成之后，才是我认为整套系统最复杂的部分——信息处理。

这168个信源其实已经不算多了，但每天抓取回来的信息，仍然有几百条。比如昨天一天，就抓了563条。

你要相信，这么多条目，不可能有人能逐一看完，这就是纯粹的信息爆炸，毫无意义。

而且其中有很多其实跟AI毫无关系。看上面的漏斗图就知道，大约有一半是无关信息。

比如苹果的Newsroom，它大部分内容不过是各种常规公告，不能因为苹果做了Apple Intelligence，就把苹果的所有新闻都当成AI新闻看待。

所以，这就引出了我最核心的模块：精选机制。

如何从已抓取的靠谱信源中，再提炼出真正值得关注的信息，精准推送到我面前——也就是“精选”这个标签页里那些经过甄选的内容。

你会发现，每条被精选的信息，在信息卡片上都被打上了标签和分数，点击标题还可以跳转到原文。

展示出来的效果看起来非常简单对吧？其实二月份刚开始做的时候，我也觉得这事会很简单。

当时我想，这能有多复杂？写个Prompt让大模型判断一下不就完了？让大模型直接给个分数，然后设定一个阈值，过了阈值就值得精选，完事了。

但越做到后面，越发现完全不是这么回事。我想得太天真了，实际情况远比想象中复杂。

这个评分策略，我前后整整迭代了11版。

详细的Prompt、多维评分机制以及最终的数值设计，我确实不方便全盘托出，但整体的架构处理流程，我觉得还是可以和大家分享一下的。

抓取完成后，首先由DeepSeek V3.2进行预筛，判断这条信息是否与AI相关。如果相关，就推送到下一步；如果无关，则直接落库，不再进行后续的评分。

Insights

AI越强，为何更需人类把关？——人机回环（HITL）深度解析

提到AI自动化，很多人的第一反应是——用机器彻底取代人工。
但真正成熟、可落地、可规模化的AI系统，恰恰相反：人非但没有被淘汰，反而被刻意保留，成为系统稳定与进化的关键枢纽。

这便是：Human-in-the-Loop（HITL）——人机回环。

一、什么是人机回环（HITL）？

简单来说，HITL 就是在 AI 的自动化流程中，有意识地嵌入一个“人的决策节点”，而不是追求全自动。

如果把 AI 比作一辆高速飞驰的赛车：

AI 是引擎，提供效率与速度
人类是领航员，负责方向修正
人类也是副驾驶，在需要制动时果断介入

HITL 并不是自动化的退让，而是自动化的增强。

典型 HITL 流程像一个持续生长的闭环：

输入 → AI 判断 → 人类复核/干预 → 最终决策 → 反馈至模型 → 模型变得更加聪明

它并不是单次流水线，而是一条不断迭代的进化通道。

二、系统架构视角：HITL 是闭环控制的必要一环

传统 AI 架构是一条单向通道：

数据 → 模型 → 输出

而 HITL 架构则是一个环形回路：

数据 → 模型判断 → 人工干预 → 决策 → 新数据 → 模型优化

在这个架构当中，人类承担着三重关键角色：

角色	职责
训练者（Trainer）	在模型早期提供高质量标注数据，为其建立认知基线
评审者（Reviewer）	当 AI 置信度不足时，启动人工审核，把关质量
安全监护者（Safety Guard）	在关键风险节点行使最终裁决权，防止灾难性后果

HITL 从不是事后打的“补丁”，而是控制系统里内生的一环。

Insights

ChatGPT广告平台正式上线！AI行业走向注意力与生产力分岔路

今日凌晨，OpenAI再次带来一系列更新。

其中就包括在ChatGPT上线全新的非推理模型GPT‑5.5 Instant，目前已经是ChatGPT的默认模型。

这里对模型不做过多展开，简而言之，它的对话风格更贴近GPT‑4o，幻觉更低，数据准确性更高，回复也更为精炼。同时，它能更好地利用你的各种记忆信息。

此外，紧随GPT‑5.5 Instant发布之后，OpenAI又宣布了一项重磅动作：面向企业主全面开放广告平台。这件事相当有趣，值得好好聊一聊。

你可以把它理解成ChatGPT的广告投放后台。美国的企业主能够直接注册账户、充值、设定预算、选择竞价策略、上传广告素材，一键投放到ChatGPT的对话中，并实时监测数据、实时优化。

其实早在今年1月，ChatGPT的广告测试就已启动，首批测试覆盖美国、澳大利亚、新西兰和加拿大的免费用户，当这些地区的用户使用ChatGPT时，对话中就会出现广告。在用户端，广告的形态是这样的。

当你向ChatGPT提问，AI照常作答之后，回答下方会弹出一个标有「Sponsored」的广告模块。该模块可以展示一个或多个广告主的产品，而在较长的对话中，ChatGPT还会综合上下文，决定是否展示广告以及展示哪些广告。

这样一来，你就不难理解为什么这一次更新中，「记忆」功能成为一个有趣的看点。

毕竟，你的记忆现在可以由AI光明正大地替你保存，这对广告推荐而言精准得可怕，传统推荐算法在它面前反而显得粗糙。

OpenAI始终强调，广告模块独立于回答模块，也就是说，广告不会左右ChatGPT的回答。广告运行在独立的系统上，广告主没有能力干预、排序或改变AI的输出内容。同时，广告主也看不到你的对话记录、聊天历史、记忆或任何个人信息，他们只能拿到汇总的匿名数据，比如总展示量和总点击量。

付费用户以及18岁以下的未成年用户使用ChatGPT时，不会见到广告。但免费用户就需要面对广告了。当然，你也可以在设置中选择关闭广告，但代价是消息额度降低，同时丧失部分功能，如图片生成和Deep Research。也就是说，想继续享受这些功能，就必须接受广告，就像玩小游戏时，用注意力换取金币。

再看投放端，这才是这次最重磅的动作。今年1月，OpenAI宣布在Free和Go用户的对话里测试广告，但当时属于封闭试点，只能通过OpenAI官方或代理商投放，起投门槛25万美元，很多企业主想试水也根本投不进去。如今测试结束，OpenAI的广告主后台正式向所有企业开放，不过首批依然仅限于美国企业。任何美国企业都可以直接去OpenAI Ads注册、自行投放。在官方后台，可以设置预算与出价策略，上传广告素材，创建Campaign和Ad Group，一键启动，然后实时查看效果。起投门槛也从25万美元骤降至5万美元。

目前ChatGPT广告支持按千次展示成本（CPM）和按点击成本（CPC）两种购买选项，CPC建议出价3至5美元每次点击，CPM默认最高出价高达60美元，贵得离谱。要知道，Meta的CPM通常不到20美元，ChatGPT是它的3倍。在OpenAI看来，ChatGPT用户会在平台内提出各种各样的问题，比如买什么笔记本好、去哪里旅游、失眠怎么办、哪种保险划算。因此，用户处于主动决策状态，而不是被动地刷信息流，是真正想要解决某个问题。这种高意图场景下的广告触达，完全值这样的高价。

以上就是OpenAI Ads的全貌。如果说之前只是广告试水，那么今天，ChatGPT可以说正式开门迎客了。未来几年，广告很可能会成为绝大多数线上AI产品的最终宿命。

要理解OpenAI的这项决策，其实并不复杂，直接看一组数据就能明白。ChatGPT目前拥有9亿周活跃用户，其中付费订阅用户约5000万。免费转付费的比例在5%到6%之间，也就是说，每100名ChatGPT用户中，约有94到95人是免费用户。这5000万付费用户也分多个层级：每月20美元的Plus、每月100或200美元的Pro，以及企业版Team和Enterprise。其中，Enterprise用户的12个月留存率高达88%，十分亮眼；但Plus用户的12个月留存率仅为59%，将近一半的人付费一段时间后就离开了。免费用户的流失更为夸张，月流失率达到19%，差不多每五个人中就有一个每月来了又走。

去年9月，OpenAI还联合哈佛大学和杜克大学的研究者发布了一篇名为《How People Use ChatGPT》的论文，分析了大约110万条随机抽样的对话。

可以说，在ChatGPT乃至整个AI生态的用户群中，存在着两种截然不同的人群。一类是付费用户。他们可能是程序员、内容创作者、产品经理、咨询顾问或研究员，将ChatGPT纯粹当作生产力工具，追求更优的模型、更长的上下文、更强大的智能代理能力。这群人每月花费20到200美元，购买的是效率和能力。另一类是免费用户。在ChatGPT生态中，这样的用户超过8亿，他们用ChatGPT搜索信息、提问、写作业、翻译、闲聊，可能每天用一两次，也可能每周才用两三次。他们不需要GPT‑5.5级别的推理能力，也不需要Claude Code那样的编程辅助，他们需要的只是一个好用、免费、能随时提问的东西。必须强调，这两类人群没有高低之分，都极其正常，也都是真实的需求。只不过，这两类需求之间隔着一条巨大的鸿沟。前者渴求的是生产力，后者寻求的是便利。

ChatGPT如今的用户量级，几乎已是全球Top级别，它早已不只是一个产品，而已经成为一个入口。当你的用户越来越趋于全民化，你自然会更加清楚地看到这两种需求之间的鸿沟有多大。于是，引入广告几乎成了必然，OpenAI也选择走上了Google、Meta等公司当年走过的老路。或者换一个更残酷的事实来看，如同很多游戏里我们常调侃的那样：免费玩家实际上是付费玩家的游戏体验。在互联网世界里，情况也差不多。免费用户并非慈善对象，免费用户本身就是商业模式。所以，与其问OpenAI为何要做广告，不如换个问法：一个周活跃用户达9亿的免费入口级产品，有可能不做广告吗？几乎不可能。

特别有趣的是，今年2月，Anthropic发布了一篇题为《Claude is a space to think》的博客。

里面非常明确地表示，Claude永远不会上线广告。他们甚至拍了一支超级碗广告来嘲讽ChatGPT上广告的做法，花费数百万美元，就为在全美观众面前喊出一句：「Ads are coming to AI. But not to Claude.」

配合那位演员的笑容，显得既讽刺又意味深长。当然，Anthropic选择不做广告，绝不是因为他们道德更高尚，这纯粹是由用户结构决定的。Anthropic的核心收入来自企业客户和API调用，付费用户占比远高于ChatGPT，但其消费端用户总量远小于ChatGPT。他们没有8亿免费用户需要养活，因此完全可以说「去你的广告，我们靠订阅和企业合同就足够了」。于是，双方走上了分岔路。OpenAI选择了入口路线，9亿用户，免费优先，广告变现，把盘子做大。Anthropic选择了工具路线，以企业用户为主，订阅为主，不打广告，深挖价值。这其中有什么高下之分吗？我真心觉得没有。一个卖注意力，一个卖生产力，只要仍在互联网体系的框架下构建商业模式，终归要在这两条路里选择一条。

注意力变现的底层逻辑，简单来说只有一句话：让用户在你的产品里停留越久越好。用户待的时间越长，看到的广告就越多，你的收入就越高。Google、Meta、字节跳动，全部遵循这套逻辑。但这套逻辑也会逐渐改变产品本身。拿ChatGPT来说，一旦它的KPI变成用户日均使用时长和广告展示次数，它的产品团队会怎么做，我们大致都能猜得到。那些没能把握好平衡的产品，就像当下的许多搜索引擎，当年也曾干净如白纸，能搜到真材实料，如今却几乎成了广告墙。广告模式的产品，最终都将变成一台注意力捕获器，这没有办法，是宿命。而生产力变现的逻辑则完全相反。它的目标是让用户尽快完成任务，然后离开。

用Codex写代码，用Cowork整理文档，这些工具的价值在于替你节省时间，让你把8小时的活压缩成2小时干完。你完成任务越快，对工具的评价就越高，续费的意愿也就越强。因此，生产力工具的优化方向是效率：更快的响应、更准确的输出、更少的废话。你问一个问题，它给出一个精准的答案，就此结束。它不需要你在界面里多待哪怕一秒钟，因为它的收入来自订阅费，与你的停留时长毫无关系。这两种模式最终会催生出形态截然不同的产品。注意力变现的AI会越来越善于聊天，善于引导对话、推荐话题，让你觉得再聊一会儿也挺有意思。它的回答会越来越多元、越来越丰富，越来越带有所谓的内容属性。而生产力变现的AI会越来越擅长干活，善于理解任务、拆解需求，一次性给你一个能用的结果。它的回答会越来越精准、越来越简洁、越来越有工具属性。如果拿熟悉的例子类比，一个正在变成AI时代的抖音，另一个则在变成AI时代的Office。

当然，我自己也一直在思考，是否存在第三条路。Anthropic在那篇《Claude is a space to think》的博客中，还提到了一个很有意思的词——agentic commerce，即代理式交易。

就是由AI直接替你完成一笔交易，帮你订机票、买东西、预约服务，然后AI从交易中抽取一定佣金。这其实就是如今美团、滴滴、电商这一类平台抽佣模式的翻版。它切入的既不是注意力市场，也不是软件订阅市场，而是交易市场。如果是交易市场，那想象空间就极为广阔了。仅电商一项，全球一年的GMV就高达约7万亿美元，此外还有旅游市场、金融市场、本地生活市场等。AI只要能从中切走哪怕1%的佣金，那也是千亿美元量级的生意。但这条路目前还为时过早。AI代理到底能不能真正可靠地完成一笔交易？能不能处理退款、售后和纠纷？用户是否愿意将下单这件事全权交给AI？这些问题一个都还没有被验证，更不用说所谓的agentic commerce了。这种商业模式要真正跑通，估计还需要一到两年的时间。

因此，我认为当下的现实是，广告仍然是入口型AI产品最走得通的路。不是唯一的路，但确确实实是最成熟的路。代理式交易或许是未来的路，但那个未来还没有到来。所以，看起来只是ChatGPT正式上线了广告主平台这么一件小事，实际上却标志着AI行业的一次大分裂。历史上所有的浏览器、搜索引擎、信息流平台，最终都变成了一件事：一台让你看广告的机器，只不过这台机器做得越来越精美，精美到你忘了它原本是为你的需求服务的。至于那条尚未被走通的第三条路，谁会第一个走出来，说实话我还远远看不清。但我隐约觉得，那才是AI真正让人兴奋的可能性，也是我最想去尝试一下的未来。

Insights

CI/CD完全指南：持续集成与持续部署的工作原理与搭建实践

核心要点

CI/CD 是一套自动化流程：每次代码变更都会自动触发构建与测试（CI），验证通过后立即自动部署到目标环境（CD）。它要解决的根本问题是“人工操作不可靠”，能将上线风险降低 80% 以上，把发布耗时从天级压缩到分钟级。

关键数据
◆ 风险降低 80%+
◆ 发布耗时降至分钟级
◆ 已成为现代开发团队的标配

一个典型场景：一行代码引发的线上故障

你改了一行代码，在本地运行完全正常，于是信心十足地把它提交到了服务器。结果线上系统直接崩溃——那个看似无关痛痒的改动，与别人的代码发生了冲突，或者依赖的运行环境并不相同。这种经历，几乎所有写过代码的人都曾遭遇过。

传统的部署方式是：写代码 → 手动打包 → 上传到服务器 → 停止服务 → 替换文件 → 重新启动。每个环节都依赖人工操作，每一步都有出错的可能。更糟糕的是，当你终于发现问题时，那段代码已经在线上运行了好几个小时，受影响的用户可能已经达到数万人。

CI（持续集成）：为每次代码提交做全面体检

CI，即 Continuous Integration（持续集成）。它的核心理念是：团队成员频繁地将自己的代码合并到主干分支，每次合并都会触发一次自动化的构建与测试流程，确保新加入的代码没有破坏已有的功能。

自动构建 — 将源代码编译成可运行的软件包，保证代码能够正确完成编译
自动测试 — 执行单元测试、集成测试，及时发现逻辑错误和边界问题
快速反馈 — 几分钟内就能告诉你代码是否存在问题，而不必等到上线之后

简单来说，CI 就是在你提交代码后，自动替你进行一次全方位的健康检查。有问题当场就能发现，不必等到用户被影响、被激怒之后才回过神来。

CD（持续交付/持续部署）：从代码到生产环境的自动化之路

CD 通常有两种解读，但本质相同：Continuous Delivery（持续交付）或 Continuous Deployment（持续部署）。二者的区别只在于最后一环是否需要人工确认。

▲ 持续交付 — 代码通过所有测试后，会自动部署到 staging 环境，但上线到生产环境需要手动批准
▲ 持续部署 — 所有测试通过后，自动上线到生产环境，整个过程完全无需人工干预
▲ 共同前提 — 必须具备充分的自动化测试覆盖率作为保障，否则自动化部署就等同于自动制造故障

关键区别
持续交付是“一键部署”，而持续部署是“自动部署”。大多数团队只要能先做到持续交付，就已经比传统方式进步了一大截。

一个典型的 CI/CD 流水线实战：5~15 分钟完成从代码到 Staging

下面用一个最简单的例子来说明 CI/CD 在实际项目中如何运作。假设有一个三到五人的 Web 应用团队。

Insights

Claude Code 实战复盘：从 Vibe Coding 到 Agentic Engineering，我的血泪教训与工作流升级

2025 年 2 月，Andrej Karpathy 在推文中抛出一个新词——“Vibe Coding”（氛围编程），意味着一种全新的编程方式：完全凭感觉，用自然语言向 AI 描述需求，“忘掉代码的存在”。这条推文瞬间引爆了开发者圈。短短几周，Y Combinator 里 25% 的创业公司已经开始用这种方式写代码。整个社区都在沸腾：AI 终于让编程变成了“动动嘴皮子就行”的事。

仅仅一年后，Karpathy 自己却说：Vibe Coding 这个词已经过时了。 他提出一个新概念——“Agentic Engineering”，即智能体工程。究竟发生了什么？为什么“开口就能写代码”这么爽的事，不到一年就被认为不够用了？

我使用 Claude Code 做日常开发已有大半年，完整经历了从“天哪这也太爽了”到“等等，好像哪里不对”再到“原来如此”的过程。这篇文章不是概念科普，而是踩了无数坑之后的真话。

Vibe Coding 的爽感，真实不虚

先说好的一面。Vibe Coding 确实爽，特别爽。

我第一次用 Claude Code 大概在去年下半年。在此之前我用过 Copilot、Cursor，体验就是“有个聪明的补全工具”。但 Claude Code 完全不同——它在终端里直接操作你的整个代码仓库。你说一句“帮我把这个项目加上用户注册功能”，它就自己去读文件、理解架构、写代码、跑测试、修 bug，你在一旁端着咖啡看戏就行。那种感觉就像从手动挡直接切换到了自动驾驶。

Karpathy 说过一段非常精准的话：

“There’s a new kind of coding I call ‘vibe coding’, where you fully give in to the vibes, embrace exponentials, and forget that the code even exists.”

忘掉代码的存在——这句话太对了。你不需要操心用什么设计模式，不用纠结变量命名，更不需要在脑子里模拟程序的执行流程。你只需要说出你想要什么，剩下的全部交给 AI。

Insights

Claude Code连接DeepSeek V4终极指南：开源工具CC-Switch配置全攻略

接续上篇安装教程，当你安装好Claude Code后，很可能兴冲冲地打开终端输入claude——结果却卡在要求登录Anthropic账号的界面。即便跳过登录，你又会遭遇另一个棘手问题：Claude Code默认只认Anthropic自家的模型，直接把DeepSeek的API地址填进去是无法工作的。别灰心，这篇续章将手把手带你用开源工具CC-Switch突破限制，让Claude Code顺利调用DeepSeek V4。

直接配置DeepSeek为何频频受阻？两大核心障碍解析

不少用户尝试在~/.claude/settings.json里设置环境变量来指向DeepSeek：

{
    "env": {
      "ANTHROPIC_BASE_URL": "https://api.deepseek.com",
      "ANTHROPIC_API_KEY": "你的Key",
      "ANTHROPIC_MODEL": "deepseek-chat"
    }
}

实际测试下来，你会发现两个关键难点：

障碍一：模型名称白名单校验
Claude Code内部固化了模型名白名单，只认以“claude-”开头的标识符。若传入deepseek-chat，它会在本地就抛出“模型不存在”的错误，根本不发起实际请求。

障碍二：API协议格式不兼容
即使想办法绕过了名称检查，Claude Code发送的是Anthropic Messages API的请求格式，而DeepSeek兼容的是OpenAI Chat Completions格式，两者的请求体和响应结构截然不同，无法直接对话。

要同时攻克这两个难关，就需要一个**“中间人”——它接收Claude Code的请求，进行格式转换后转发给DeepSeek，再把响应翻译成Claude Code能识别的格式返回。这个中间人便是CC-Switch**。

认识CC-Switch：Claude Code模型切换利器

CC-Switch的全称是Claude Code Model Switch，是一个开源项目（GitHub: win4r/CC-Switch），由社区开发者维护，专门用来让Claude Code调用非Anthropic的模型。

工作原理简述：

在本地启动一个HTTP代理服务（默认监听127.0.0.1:15721）
Claude Code的所有请求都发送到这个本地代理
CC-Switch接收Anthropic格式的请求，将其转换成OpenAI格式
转发给DeepSeek（或任何兼容OpenAI接口的国产大模型）
收到响应后，再转回Anthropic格式，返回给Claude Code

项目亮点：

完全开源免费，MIT协议
跨平台支持Windows、Mac、Linux
内置多种国产模型配置模板（DeepSeek、通义千问、智谱、文心一言等）
图形化操作界面，无需编写代码
支持多Provider灵活切换
当前最新版本：v3.14.1

💡 通俗理解：CC-Switch就像是Claude Code与DeepSeek之间的实时翻译官——双方的语言不同，翻译官在中间完成双向转译。

安装CC-Switch的两种方式

方式一：从GitHub下载安装包（推荐新手）

访问 https://github.com/win4r/CC-Switch/releases ，根据你的系统选择对应的安装包：

Windows → 下载 CC-Switch-v3.14.1-Windows.msi
Mac (Intel) → 下载 CC-Switch-v3.14.1-x64.dmg
Mac (苹果芯片) → 下载 CC-Switch-v3.14.1-arm64.dmg
Linux → 下载 CC-Switch-v3.14.1.AppImage

下载后双击安装，按向导完成即可。

Insights

从AI旁观者到一人军团：三年亲历总结的十个使用能力等级

今天想聊点有意思的事。

前段时间出差，和一帮许久未见的老朋友吃饭，席间自然而然地聊到了AI。

一个朋友兴奋地说，他用AI帮老婆做了一份结婚纪念日的小贺卡，效果炸裂，老婆直接看哭了。

另一个朋友则接过话头：“你这还只是入门，你真应该建一个项目，把你们从恋爱到结婚的所有故事全喂进去，让Agent自己读完之后再去写，那才叫神作。”

说着说着，话题就滑到了做PPT、查资料上，有人开始吐槽：“现在的AI根本没法用，一本正经地胡说八道，全在瞎编。”

马上就有人反驳：“都2026年了，你能不能换点好用的AI？根本不可能。”

争论随之升级，每个人都觉得自己才是真正的AI高手。

混乱中，隐约听到隔壁桌也在谈AI，一个说用AI学习和查资料，另一个则在科普小龙虾。

那顿饭吃得我有点恍惚。

其实大家心里都清楚，同一个AI、同一个Agent，不同的人用出来的效果天差地别。可这个“差”到底差在哪里？怎么量化？我们自己现在到底处在什么阶段？下一步又该怎么走？

经常有人问我：“教练，我想学AI，到底该怎么开始？”每次听到这种问题我都头疼，因为这个问题实在太过宏大。

饭局回来的路上，我脑子里突然冒出一个想法。

如果把这条AI使用之路具象化，变成一种类似打游戏升级等级的过程，会怎样？如果AI也有“熟练度”这个概念，它应该怎么分等级？

我花了好长时间，把这三年来观察到的形形色色的人——同事、公众号留言区的读者、各种场合里聊过天的朋友——全部在脑子里过了一遍。

最终，我提炼出了四个递进的维度，这四个维度共同构成了AI使用度的十个等级。

第一个维度是可控性。从最初觉得AI胡编乱造、离题万里，到慢慢知道怎么约束它，怎么喂给它准确的上下文，怎么设计“缰绳”让它精准产出。

第二个维度是广度。从只在自己熟悉的一亩三分地里打转，到借助AI开始跨行业探索，从窄视野走向广天地。

第三个维度是形态。从用对话式聊天机器人，到用能执行长程任务的智能体，从单次问答走向多步自主协作。

第四个维度是角色。从纯粹的消费者，到成为创造者，从只会套用别人的提示词，到亲手打造属于自己的技能模块。

这四个维度，共同铺就了十个等级。

它们并不是齐头并进的。你可能可控性很高，但广度很窄，整天只在自己小圈子里转；也可能广度铺得很开，什么都想试试，但角色始终停留在消费者，从没沉淀出属于自己的东西。

但综合来看，你在这四条线上所处的位置，基本就能判断出你当前处于第几级。

我写这个并不是为了制造焦虑。AI进展太快了，我只是希望，在眼下这个时间节点，你看完之后能和周围的人对一对号，知道自己在哪，也清楚下一步该往哪儿走，这才可能百尺竿头更进一步。

同时我先叠个甲：这个等级体系只是我自己为了分类、为了好玩而做的，也仅针对大多数普通的AI用户，不涉及某些特别专业的领域。如果有不同意见，那一定是你对。

如果你也有朋友想问你“怎么学AI”“怎么进步”，你也可以把这篇文章发给TA。

那，我们正式开始。

Lv.0 旁观者：隔岸观火的局外人

’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

旁观者知道“AI”这个词，也许看过一些新闻，但从未真正和任何一款大模型对过话。

这个等级听起来离我们挺远，但实际上，全球大概还有80%的人正站在这个起跑线上。

这时候我又要掏出这张经典图片了。

’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

不过在国内，这一级的人数应该已经越来越少。

如果想从旁观者跨入Lv.1，方法简单到不能再简单：你不需要纠结哪款AI最好，直接打开手机应用商店，搜“豆包”“千问”“元宝”“DeepSeek”之类，哪个图标看着顺眼就下哪一个。打开，问它一句话，随便什么都行，就算问一句“今天该穿什么”也行。

迈出这一步，你就到了Lv.1。

Lv.1 尝鲜者：刚推开大门的体验派

’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

这个阶段，你开始真正上手了。

基本用法就是：“帮我写个XX”，然后坐等收菜，AI给什么你就用什么。比如帮我写封邮件，帮我总结一下这个文档，帮我想个方案。

你不会追问，不会补充更多背景，拿到结果直接复制粘贴，能用就万事大吉，不行就直接弃用。

你对AI的评价完全像抽盲盒，它有时候很靠谱，有时候又极其不靠谱，可你说不清这到底是因为什么。

这一阶段对AI的感觉是模糊而混沌的，觉得AI有时候聪明得吓人，有时候又离谱得可笑，还没有构建起稳定的使用习惯。

通常你只会用一两个App，大概率是DeepSeek或者豆包，不太在意底层是什么模型，也不太清楚不同模型之间有什么差异。

坦率地说，这个阶段的人，AI在他手里不过是一个更高级一点的搜索引擎。

你会搜索，但你还不太会提问。

Lv.2 对话者：开始懂得「怎么问」比「问什么」更关键

’ fill=’%23FFFFFF’%3E%3Crect x=‘249’ y=‘126’ width=‘1’ height=‘1’%3E%3C/rect%3E%3C/g%3E%3C/g%3E%3C/svg%3E)

Insights

从Vibe Coding到Spec Coding：agent-skills用20个工程纪律驯服AI编码，星数突破33600

你是否经历过这样的场景：让AI帮你实现一个功能，它三分钟写完，跑起来居然还能用。你欣喜若狂，觉得效率瞬间翻了十倍。然而第二天你想增加一个新特性，却发现昨天的代码没有测试、没有文档，接口设计一塌糊涂。改一处坏三处，像推倒的多米诺骨牌。更离谱的是，你翻看代码时发现AI连最基本的安全检查都没做——用户输入直接拼进了SQL语句。

这种开发模式有一个名字，叫Vibe Coding：给出一个模糊意图，让AI自由发挥，只要能跑通就算完事。短期来看确实很爽，但代价是技术债务疯狂累积——Controller里塞满业务逻辑，Service里直接拼接SQL，异常被catch后只打印一句“failed”，第二天再动一发而动全身。等到真正需要维护的时候，你就会明白，“能跑”和“能交付”之间横着一条鸿沟。

而与它对立的，是Spec Coding：先定义好技术规范和代码风格，让AI始终在同一套规则下工作。说直白些，Vibe Coding是放养，Spec Coding是立规矩。

AI编码工具的能力确实越来越强，但模型越强，抄近路的毛病就越明显。拿到任务就一头猛冲，不会主动补上测试、边界、安全和可维护性。这也是AI编码最容易翻车的地方。

最近，Addy Osmani开源了一个项目：agent-skills。它将资深工程师的工作流和开发规范，封装成了20个可复用的技能包，让AI在每一个开发阶段都按照工程纪律行事。

起初我以为这不过又是一套Prompt集合，等读完整座仓库的结构后，才发现它有价值的不是提示词本身，而是把工程流程拆解成了可执行的检查点。项目已经收获三万多GitHub Star，并且还在持续攀升。它不是简单地堆砌Prompt，而是把需求、计划、测试、评审、上线这些工程动作拆成可执行的流程。

即使你暂时不用AI编码工具，这个项目的设计思路也值得花时间深入理解。

本文篇幅较长，建议收藏，通过它你将彻底搞懂下面几点：

agent-skills到底在解决什么问题：AI编码Agent为什么总是写出“能跑但不能交付”的代码。
20个Skill如何覆盖完整开发周期：从需求定义到上线发布的六阶段全景图。
在Claude Code中安装后实际效果如何：亲身体验与核心价值。
Skill内部机制为什么远超普通Prompt：反合理化表、渐进式披露等设计的拆解。

这个项目到底在解决什么

先承认一个很多人不愿面对的事实：当前主流的AI编码Agent，默认选择的是最短路径。

所谓最短路径，就是拿到任务直接写代码，跳过需求分析、跳过设计评审、跳过测试策略、跳过安全审查。代码只要能跑起来就算达成目标。这和一个刚入职的初级开发者别无二致——甚至还不如，因为初级开发者至少还会问问前辈“这样写行不行”。

agent-skills的核心理念是：给AI立规矩，让它在每一步都按资深工程师的标准工作，而不是纵容它走捷径。

简单说，Skill不是让模型“知道更多”，而是告诉它：什么时候该做需求澄清，什么时候该写测试，什么时候必须停下来做评审。

Harness 和 Prompt/Context Engineering 的嵌套关系

从架构分层的角度看，Skills位于Harness的信息边界层和执行编排层。理解了这一定位，后续每一个Skill的设计逻辑就会非常清晰。

项目的作者Addy Osmani长期深耕Google Chrome、DevTools、Web性能以及AI开发体验等领域，很多前端和自动化开发者都间接受到过他项目的影响。如果你用过Chrome DevTools调试页面、用Lighthouse跑过性能评分、用Puppeteer做浏览器自动化，那么你早就是他作品的使用者。这些背景并非闲笔。agent-skills中的工程方法论，大多数源于《Software Engineering at Google》这本书。Hyrum’s Law、Beyoncé Rule（简单说就是：如果你喜欢它，就该给它写测试）、测试金字塔、主干开发、变更大小控制——这些都是Google内部经历过大规模验证的工程实践，而不是抽象的原则。Addy把这些实践翻译成了AI Agent可以执行的结构化工作流。

20个Skill：覆盖从想法到上线的完整链路

agent-skills围绕软件开发生命周期设计了20个Skill，分布在6个阶段。

阶段	核心目标	包含的 Skill
定义（Define）	搞清楚要做什么	idea-refine、spec-driven-development
规划（Plan）	拆解成可执行的单元	planning-and-task-breakdown
构建（Build）	按规范写代码	incremental-implementation、test-driven-development、context-engineering、source-driven-development、frontend-ui-engineering、api-and-interface-design
验证（Verify）	证明代码是对的	browser-testing-with-devtools、debugging-and-error-recovery
评审（Review）	上线前的质量门禁	code-review-and-quality、code-simplification、security-and-hardening、performance-optimization
发布（Ship）	安全部署到生产环境	git-workflow-and-versioning、ci-cd-and-automation、deprecation-and-migration、documentation-and-adrs、shipping-and-launch

光看表格你可能会觉得不过是功能清单，但每个Skill背后的设计逻辑值得单独剖析。