小米MiMo 16亿Token限期将至:四款AI大模型消耗方案深度对比,谁的建议更有价值?
眼看着小米 MiMo 赠送的 16 亿 Tokens 即将过期,账户里还剩十几亿额度,焦虑感油然而生。

必须赶紧找办法把它们消耗掉,浪费了实在可惜。可问题是,我一时并没有那么大的需求。平时用 Opus 4.7 开发时一直精打细算,从没有大手大脚烧 Token 的习惯;如果把正在推进的项目全部交给 MiMo,心里又不太踏实。
于是我把难题抛给了 AI,把能问的模型都问了一遍。结果发现,大多数 AI 的回答大同小异,但总有那么几个会想得更深一层。就跟人一样,智商高的会在问题之上再思考一层,而智商低的就只是你让干什么就干什么,从不琢磨怎样做得更好。
我先把自己的需求描述清楚:
如何在短时间内消耗大量 Tokens,并做出有意义的产品。目前主要关注 AI 领域,可以是文档、软件、网站等方向。
接下来,就记录一下不同 AI 给出的答案。
1. MiMo:循规蹈矩的指示执行者
既然是 MiMo 送的 Token,先来问问它本尊。
问答截图如下:

它主要列出了三个方向:文档类产品、软件类产品、网站/可视化产品,几乎完全按照我提示词里的关键词做了分类回应。
这里截取它给的部分内容:
1. AI 技术知识库 / 行业报告
做什么:生成一本结构完整的 AI 领域电子书(如《大模型落地实战手册》《Prompt Engineering 从入门到生产》)
为什么烧 token:每章需要先调研→大纲→初稿→审校→润色,一本书 15-20 章,每章 3000-5000 字
预计消耗:单轮对话 50-100K tokens,多轮迭代可达 300K+
价值:可发布为 PDF / GitBook / Notion 模板,直接变现
2. 系统化 Prompt 模板库
做什么:为不同行业(法律、医疗、教育、电商、代码审查等)构建 100+ 个经过测试的 Prompt 模板
为什么烧 token:每个模板需要场景分析 → 多版本生成 → 效果对比 → 迭代优化
预计消耗:200K-500K tokens
价值:可做成 SaaS 产品或付费课程配套资源
3. 竞品分析报告
做什么:对 AI 领域某个细分赛道(如 AI Agent 框架、向量数据库、RAG 平台)做深度横评
为什么烧 token:每个产品需要功能拆解 → 代码示例 → 架构分析 → 优劣势对比
预计消耗:100K-200K tokens
这份回答在“AI 技术知识库/行业报告”“系统化 Prompt 模板库”“竞品分析报告”这三个细分方向上,把做什么、为什么烧 Token、预计消耗、价值四个维度都讲清楚了。就结构而言,可以说该有的都有。
小米MiMo深度评测:6400万Tokens缘何撑不起一个武侠百科?
MiMo 的 16 亿 Tokens 额度即将耗尽,我赶紧追加了一波测试。结果……彻底垮掉。虎头蛇尾,金玉其外,败絮其中。
先上一张图,各位感受一下:

就这个网页,吃掉了 16 亿 Tokens 额度的 4%,约合 6400 万!
同一道题,Opus4.7 和 Gemini3.5 的表现完全碾压它!
Opus4.7 做出的效果:

Gemini3.5 做出的效果:

界面展示完了,我们来深挖一下细节。
这是 AI 实战开发测试《江湖百晓生》的第二篇!
核心需求是:构建一个以金庸、古龙武侠世界为主题的百科,要囊括主要人物、兵器、武功等核心要素。
下面我将完整还原开发工具、开发过程,带你沉浸式感受 MiMo 在真实场景中的能耐。
工具环节
现在我基本不用 CCSwitch 了,一切交给自己的 JCode + Claude Code!
配置好后,打开 JCode,双击图标即可呼出 CC:

你无需在终端里敲 Claude,也不用 cd 进特定目录,更不必手动设置环境变量或修改配置文件。
只需通过软件的添加功能:

填入 API key 和正确的 Base URL,万事大吉!
小米的 base URL 其实已经内置。不过,默认接入点和 Token Plan 的接入点不同。所以如果用 Token Plan 套餐,就必须像截图中那样调整;若按用量计费的普通 API,则无需改动。
配置完成后,后续无需再费心。
2026上半年AI十大变革:从Agent Skills到Seedance 2.0,全面重塑人机协作格局
2026年的一天,一位用户通过手机向本地AI发出指令:打开一堆PDF发票整理成Excel报销单、一句话给电影《火遮眼》生成带宣传视频和海报的网站,以及按特定风格为这篇稿件撰写开头。饭做完,活也全部完成。这种事,一年前还只是科幻,今年已成日常。
这并非渲染,而是想指出:2026年上半年的AI,早已不是“哪个模型评分高”的叙事。模型端的竞逐,在GPT‑5.5、Claude 4.8、M3这一档已显露明显的边际递减。真正发生位移的地方,悄悄移到了别处——移到了如何将AI植入日常生活、融入工作流、嵌入个人电脑之中。
这半年一线测试过的产品不胜枚举,发布会看到一半就关掉的同样数不清。本文并非流水账,而是从众多事件中拣出10件亲手验证、踩过坑、形成判断的,串成一条主线。
10个话题的顺序是:Agent Skills、OpenClaw、Harness、Multi‑Agent(含Agent OS、Sub‑agent)、Coding Plan、CLI回归、Desktop Agent、Physical AI、语音交互、Seedance 2.0。
全文逾万字,细品。
一、Agent Skills:2026年最值得掌握的核心能力
整个上半年,最被低估却又最能影响一线工作流的事,就是Agent Skills。
它在半年内从一家厂商的功能,跃迁为行业标准。Anthropic于去年10月推出,12月做成开放标准,到现在OpenAI、谷歌以及国内AI厂商已全线跟进。
它究竟是什么?一言概之,Skills是一个文件夹,里面必须包含一份SKILL.md:开头是YAML元数据(name和description),下面是Markdown写成的执行说明,并可附带可选的scripts子目录、references子目录和assets资源文件。
skill-name/├── SKILL.md (必需)│ ├── YAML frontmatter (必需)│ │ ├── name: (必需)│ │ └── description: (必需)│ └── Markdown instructions (必需)└── Bundled Resources (可选) ├── scripts/ - 可执行代码 ├── references/ - 参考文档 └── assets/ - 资源文件
Agent Skills最精妙之处在于progressive disclosure,即渐进式披露机制,共分三层。第一层是元数据,每个Skill约50到100个token,会话启动时所有Skill的name与description都进入系统提示词,模型只是“知道有这些Skill存在”。第二层是指令,SKILL.md全文建议控制在5000 token、500行以内,仅当模型判定当前任务匹配某Skill时才加载进上下文。第三层是资源,scripts和references等更深层文件,只会在SKILL.md主动引用它们时才进入上下文。

这套架构解决了一个极为现实的问题——上下文的稀缺性。早期Agent的痛点是想往System Prompt里塞更多专业知识,塞得越多模型越糊涂。Skills把“有哪些能力”和“具体怎么干”在物理层面拆开,让模型只为正在做的事情付出token。
Skills真正解决的,并非prompt的长短,而是个人知识的资产化。组织里最值钱的从不是写在手册里的SOP,而是只有少数资深员工才知道的“这个表必须按这个口径填”。过去这种事要么口口相传,要么写成员工手册然后被束之高阁。Skills第一次让个人或团队的方法论具备了可分发、可复用、可版本化管理的形态。
实际体验下来,最直接的感受是效率神器。以常见的内容创作流程为例,可构建覆盖选题、风格、标题生成的Skills集合。每添加一个新Skill,模型在未触发时完全察觉不到,触发后却能精准照做。这种“加它不亏,用它管用”的体验,是传统提示词工程时代无法想象的。
时间来到2026年6月,再提“学会怎么问AI”已显过时。该学的是怎么教AI,而Skills是这件事最干净的载体。
二、OpenClaw:全民Agent的第一次破圈
2026年春节后,国内AI圈最热的名字是“龙虾”,学名OpenClaw,基于TypeScript的开源项目,作者Peter Steinberger。名字由来很简单:作者想做一个叫Molty的“太空龙虾”AI助理,后来将底层部分抽出来开源,便有了OpenClaw,“Open + 螯”。其GitHub Star数已达37万,登顶开源榜首。

它解决了一个被长期忽视的痛点。
过去做Agent,主流路径两极分化。比如ChatGPT的Operator、Manus、Genspark等,打开网页就用,体验流畅,但对话、文件、记忆全在第三方服务器上。另一类如Claude Code、Codex CLI,虽在本地运行,但本质上是写代码的终端工具,不管多通道、跨设备、永远在线这些事。
2026世界杯明日开幕,Temu合规门槛再升,阿里国际首季盈利,美线海运暴涨87%!6月跨境关键事件全解析
6月跨境圈迎来几波密集冲击:2026美加墨世界杯将于明日(6月11日)正式开赛,选品冲刺进入最后倒计时;小红书Redshop跨境电商平台正式落地,内容电商正式杀入跨境赛道;阿里国际数字商业集团首度交出季度盈利的成绩单,AI工具被指为增长的核心引擎;美线海运运费年内已累计上涨87%,旺季备货的成本压力急剧升温。
01 | 世界杯开幕在即,冲刺选品的三个低风险方向
明日(6月11日),2026年美加墨世界杯就将拉开帷幕。本届赛事首次将参赛队伍扩展至48支,由美国、加拿大、墨西哥三国共同承办,预计将吸引全球超50亿观众,无疑是2026年跨境电商领域规模最大的流量窗口之一。
海关总署数据显示,2026年1至2月义乌体育用品及设备出口额达23.4亿元,同比增幅高达38.5%。足球、球迷助威道具、户外观赛装备等品类订单呈现爆发式上扬。虽然揭幕战近在眼前,但仍有三大类不易触碰知识产权的选品方向可重点把握:
**① 通用足球周边:**包括无品牌标识的足球、训练器材、球袋球网、门将手套等产品,能有效规避FIFA官方IP侵权风险,主要面向大众消费者和业余训练人群。**② 观赛场景用品:**助威道具(气棒、旗帜、口哨)、啦啦队服饰,以及户外露营装备(便携椅、保温箱、投影幕布),瞄准家庭观赛和户外大屏观赛的场景。**③ POD定制类产品:**如球迷定制T恤、手机壳、挂件等按需生产的产品,可以借助柔性供应链实现零库存和快速响应。世界杯期间,TikTok上 #WorldCup2026 话题播放量早已突破百亿,社媒引流效果明显。
需要特别提醒的是,义乌海关已将世界杯相关出口商品列入重点查验范围,凡带有FIFA标识、球队队徽、球星肖像等官方IP元素的商品均面临扣货风险。建议卖家坚持“通用品+定制化”组合路线,远离版权红线。

📌 来源:浙江省政府官网——义乌体育用品出口数据 | 腾讯新闻——世界杯开幕时间确认
02 | 小红书Redshop正式上线,内容电商切入跨境赛道
市场传闻已久的小红书跨境电商平台“Redshop”本月正式上线启动,首批覆盖香港、澳门、美国、英国、新加坡等9个市场,初期采取定向邀请种子商户的模式,主营品类集中在非遗手工、特色手工艺品,后续会陆续拓展至更多类目。
这标志着小红书从“种草”全面走向“拔草”闭环。与TikTok Shop的短视频直播驱动、SHEIN的快时尚供应链效率和Temu的极致低价打法不同,Redshop的核心差异化落脚在**“审美溢价”**上——依托小红书上积累的图文种草心智,将非遗手工、设计师品牌等高溢价品类推向海外市场,目标锁定那些愿意为设计感与品牌故事买单的中高端消费群体。
对跨境卖家来说,Redshop的入局带来一个全新的低竞争渠道,特别匹配有设计能力、手工艺供应链优势或擅长内容营销的中小卖家。不过也应注意,小红书跨境尚处于起步期,物流、支付、售后等基础设施仍在搭建过程中,较稳妥的做法是先从“测试性投入”切入,持续跟踪平台后续的招商政策。
📌 来源:科创板日报——小红书Redshop将于6月正式上线 | 紫鸟浏览器——6月9日跨境新闻汇总
03 | SHEIN与Temu玩具美妆品类强制白名单,合规大限仅剩10天
为对接欧盟最新监管要求,SHEIN和Temu近日联合公布:自2026年6月20日起,玩具、美妆两大品类将强制实施白名单实验室专属报告制度。这也意味着,以往行业内常见的“挂靠证书”“免样办证”等灰色操作将被彻底清理。
新规要求十分明确:所有在售及新上架的玩具、美妆商品,必须由平台指定白名单内的检测机构出具专属检测报告,且证书上的送检方、品牌方、生产方等信息必须与平台卖家主体信息严格一致。不合规的商品将在6月20日后被集中下架。
对上述两个品类的卖家而言,距离截止日期仅剩10天。眼下最紧迫的动作是立刻排查现有产品证书的合规情况,核实检测机构是否处于平台白名单以内,并协调供应商尽快提供与店铺主体身份一致的检测报告。欧盟市场的合规方向已经非常清晰,从玩具美妆起步,未来将逐步延伸至更多品类,合规成本必然成为常态运营的一部分。
📌 来源:搜狐——SHEIN/Temu玩具美妆强制白名单新规
04 | 阿里国际首次季度盈利,AI工具成就跨境增长新引擎
阿里国际数字商业集团(涵盖速卖通、Lazada、Trendyol等)在最新财报中披露了一项里程碑式数据——首次实现单季度盈利,经调整EBITA亏损从前季度的数亿元大幅缩小至仅剩1.38亿元,已非常接近盈亏平衡线。
财报中明确指出,盈利的核心驱动力来自大范围落地的AI工具:AI智能选品协助卖家精准锁定目标市场热销品类,自动翻译显著降低多语言运营门槛,而无人直播则大幅压缩了内容制作成本。在速卖通平台上,使用AI工具的卖家平均运营效率提升超过40%。
这对独立站卖家同样具有参考价值。目前主流AI跨境工具已能覆盖“选品调研→多语种Listing生成→AI客服→广告素材自动生成→数据分析”的全链路,月均成本控制在50至200美元之间。与其一味增加人力,不如先用AI替代重复性工作,这正是2026年跨境卖家降本增效的最短路径。
📌 来源:新浪财经——阿里国际接近盈利,AI提效双线并进
05 | 美线海运价格暴涨87%,马士基再征2000美元旺季附加费
上海航运交易所最新数据显示,上海港出口至美西基本港的40英尺集装箱(FEU)运价已攀升至4,149美元,年内累计上涨87%;美东航线运价达到5,333美元,累计涨幅超过70%。欧洲航线方面,6月上旬报价已稳定在4,100美元/FEU以上,较5月末的2,850美元明显上移。
马士基已发官方通告:自6月17日起对远东至美加航线征收旺季附加费,40尺柜最高加收2,000美元。阳明海运、万海航运等头部船公司同步上调美线基础运价,单柜涨幅普遍在1,000至1,500美元之间。当前正值Prime Day备货(6月23—26日)和世界杯双旺季叠加,舱位紧张与高运价状态预计将持续至7月中旬。
给卖家的实操建议:①已确认参加Prime Day的卖家,应立即锁定舱位并出货,不宜再等待降价窗口;②货量较大的卖家可拆分成3至4批,采用“海运慢船+铁路+空运”的多渠道组合方式发货,以摊薄单次物流成本;③建议将70%以上的库存提前送入第三方海外仓,FBA仅保留2至4周的安全库存,通过少量、多批次的调拨补货策略来规避旺季运价高峰。
📌 来源:中国发展网——国际海运价格接连跳涨 | 百家号——6月最新国际物流新闻汇总
**小结:**6月跨境圈“世界杯+Prime Day”双旺季,对卖家的运营能力和成本控制提出了全新挑战。选品要紧抓赛事红利,合规需紧密跟随政策动向,物流讲究提前锁舱锁价,运营要善于借力AI工具——能在旺季领跑的,永远是提前一步做好准备的人。
2026智能无线烧烤温度计选品深度解析:抢占79-89美元品牌真空带的DTC机遇
一、市场全景
全球智能无线肉类温度计市场正迈入高速增长阶段。根据Verified Market Reports(2026年4月发布)的数据,2025年该市场全球规模约为1.2亿美元,预计到2034年将攀升至2.5亿美元,2026至2034年间的复合年增长率(CAGR)达到9.2%。
从更宏观的视角看,Grand View Research的数据显示,全球烧烤炉市场2025年规模已达54.9亿美元,预计2033年将达到81.2亿美元,整体CAGR为5.0%。其中,智能烤炉细分市场的增速达到6.63%(Mordor Intelligence数据),说明烧烤爱好者正全面拥抱“智能化”升级,而无线温度计则是所有智能烧烤配件中渗透率增长最快的品类。
在地域结构上,北美市场凭借超过1.3亿烧烤用户,占据全球约40%至45%的份额,是当之无愧的第一大市场;欧洲约占25%至30%,德国与英国处于领先地位;亚太地区则凭借超过10%的复合年增长率,成为增速最快的区域,市场份额约为20%至25%。

二、竞争格局解析
当前市场格局呈现出典型的“沙漏型”结构:低端30至50美元价格带已经是红海,充斥着大量白牌产品;高端200至350美元区间则由少数品牌把持;而在中端79至89美元区域,存在一个不容忽视的品牌真空地带。
最关键的发现是:市面上至今没有一款产品能够同时满足“双探头真无线 + 双频WiFi + App智能引导 + 精致设计”,并且将价格定在79至89美元之间。入门级的GoveeLife单探头版本定价69美元,体验并不完整;ThermoPro TempSpike单探头款价格为79至99美元,功能有所欠缺;再往上一级,价格直接跃升至119美元以上,中间形成了一个空白区间。
| 品牌 | 价格 | 评分 | 核心卖点 | 明显短板 |
|---|---|---|---|---|
| MEATER Plus | $99-119 | 4.5★ | 真无线先行者、Guided Cook、双传感器 | 仅支持蓝牙165英尺、单探头、无WiFi、连接偶尔不稳 |
| ThermoPro TempSpike | $79-99 | 4.2★ | 双频WiFi+蓝牙、500英尺范围、IP67防护 | 仅为单探头、App功能相对简单、外观偏工具化 |
| Typhur Sync | $199-269 | 4.5★ | 6传感器、±0.5°F精度、0.5秒响应、铝合金底座 | 价格是MEATER的两倍、品牌认知度尚待建立、过于专业 |
| GoveeLife 4探头 | $129-149 | 4.3★ | WiFi+蓝牙、4探头配置、72小时续航、性价比突出 | 蓝牙连接偶尔不稳、App交互不够直观、品牌调性偏工具型 |
| GoveeLife 1探头 | $69 | 4.2★ | 入门级真无线、WiFi+蓝牙、价格友好 | 仅单探头、精度仅±1.8°F、外观廉价感明显 |
| Inkbird IBT-4XS | $39-49 | 4.4★ | 极致性价比、4探头、150英尺蓝牙 | 有线探头而非真无线、无WiFi功能、品牌定位偏低端 |
三、用户核心痛点与DTC应对方案
| 痛点 | 用户反馈占比 | DTC品牌可采取的解法 |
|---|---|---|
| 蓝牙/WiFi频繁断连 | 28% | 采用双频WiFi与蓝牙5.4双模自动切换方案,基站设计远离金属干扰源 |
| 温度读数偏差明显 | 22% | 配置±0.5°F多传感器阵列,通过NIST校准,配合App提供智能引导 |
| 探针过热或烧毁 | 18% | 使用耐温1000°F的不锈钢材质、IP68防护等级,并加入过热预警机制 |
| 电池续航不足 | 15% | 提供48小时以上续航、5分钟快充功能及低电量预警 |
| App体验不佳或闪退 | 10% | 开发轻量级自研App,内置本地缓存及离线模式保障使用体验 |
四、品牌真空地带与市场机会
缺口一:79至89美元双探头无线品牌真空。
消费者想要购买一副“真无线双探头+WiFi”的产品,最低也需要99美元起步(如GoveeLife),而在79至89美元这个价格区间内,只有单探头款式可供选择。
38年重塑罗马:Gismondi 的石膏城市模型与君士坦丁大帝的帝国记忆
一座留存至今的城市模型,并不依赖文字叙述,而是通过精准的比例、真实的材料,以及如同考古学家般的持久耐心才得以呈现。罗马的建筑史被无数巨匠反复书写——米开朗琪罗、贝尔尼尼、维特鲁威。然而,真正让一座消逝的古城以物质形态重返现实空间的,是 Italo Gismondi 耗费 36 年(另一说法为 38 年)精心堆塑而成的石膏模型。这件作品远不止是一件考古纪念物,它本身就是一座将记忆凝固为物质材料的建筑。

图 整座模型占地16.764m×16.764m,以1:250比例呈现公元4世纪初君士坦丁大帝治下的罗马城。
从大理石残片到微缩罗马
公元 203 年至 211 年间,塞普蒂米乌斯·塞维鲁皇帝下令在一块巨大的大理石板上镌刻整个罗马城的平面图,这就是赫赫有名的《Forma Urbis Romae》(罗马城大理石地图)。该石板原长 18 米、宽 13 米,如今仅存约 10% 至 15% 的残片。一个多世纪后,考古学家鲁道夫·兰恰尼(Rodolfo Lanciani)依据这些碎片拼合出 1893 至 1901 年的复原图《Forma Urbis》。Gismondi 继承的不单是兰恰尼的平面图,更是一条跨越 1800 年的城市制图传统。
他不仅将兰恰尼的二维平面立体化为三维模型,还把时间坐标从塞维鲁王朝的 3 世纪推进到 4 世纪初君士坦丁大帝执政时期。每一栋保存下来的建筑物、每一段城墙、每一列柱廊,都需要在石膏中确定体量,而判断依据往往仅残存的柱础、一段台阶的走向或提图斯凯旋门现存结构。Gismondi 的方法是“以考古遗存锁定确凿部分,用类型学补足证据缺失的区域”。这一原则使模型既是严谨的科学研究,也带着合理推测的创造色彩。
政治授权下的城市重建
1933 年,墨索里尼以“庆祝奥古斯都诞辰两千年”为名委托制作这项模型。同年,他下令拆除罗马大量中世纪民居,为修建“帝国大道”腾出空间。极具讽刺意味的是,这些被夷平的建筑恰恰毁掉了 Gismondi 原本可以用来复原君士坦丁时代城市肌理的关键证据。模型工程在政治动机与考古资料匮乏的矛盾中启动,这决定了它的一部分城市面貌源于可验证的遗址,另一部分则出自 Gismondi 基于古罗马建筑类型学的合理推断。
因此,这件作品在今天看来尤为微妙:它既见证了法西斯政权对古罗马符号的挪用,也凭借顽强的考古工作保存了一段被政权刻意抹除的城市记忆。模型上的君士坦丁大殿、万神殿、大竞技场,并非服务于政治宣传的布景,而是 Gismondi 用 36 年时间,将碎片逐一拼合而出的学术判断。
实体模型:比数字孪生更持久的城市档案
1955 年,这件模型被永久安放在罗马文明博物馆(Museo della Civiltà Romana)的 EUR 分馆,Gismondi 则持续修改直至 1971 年,次年便与世长辞。时至今日,它仍是全球规模最大、信息密度最高的古罗马城市实体模型。用建筑师的话来说,这是一座“不依赖屏幕的数字孪生”——它不用算法计算视距,而是让观者的眼睛在 1:250 的比例中亲自丈量那座陨落的帝国都城。
对今天的建筑师而言,Gismondi 的工作蕴含着跨越时间的力量:当当代 BIM 模型还在追逐 LOD 精度和信息丰富度时,这件始于 1930 年代的手工模型提醒我们——真正的“城市信息”从来不止是参数组合,更是一系列在比例中可读、在材料与观察中积淀下来的判断。
AI时代必备:从提示词到上下文工程,三步构建可复用智能工作流

关键词:AI技能、提示词工程、上下文工程
AI 技术并不新鲜,但把它转化为你能用、好用且长期可复用的能力,正成为这个时代的基本功,其重要性不亚于会用电脑、会上网、会点外卖。核心差距不在于工具,而在于你如何使用它。
一次不起眼的收费,照见了基础设施化的拐点
2026年5月,豆包在 App Store 悄然上线了付费订阅:标准版68元/月,加强版200元/月,专业版500元/月,年付最高一档 5088 元。官方随即声明,基础聊天、问答、写文案和简单生图仍旧免费。网友迅速分裂为两派,一方表示“敢收费就卸载”,另一方则认为“免费不可能长久”。
这件事的关键不是价格本身,而是其背后算力逻辑的根本转变。传统互联网产品的边际成本会随用户规模递减,搜索引擎和社交平台通常靠免费圈地、广告变现。而如今按 token 计费的服务,每一次提问都产生真实的算力消耗,用户越多,总成本就越难控制。正因此,字节将 AI 基建预算从 1600 亿提升至 2000 亿,腾讯的 AI 新业务也在一个季度内拖累88亿利润。
豆包的收费试探与 OpenAI CEO Sam Altman 在同年的 BlackRock 基础设施峰会上的表态遥相呼应。Altman 将 AI 比作未来的电力和水,主张按“表”计量,用户和企业按用量付费。他还直言:想拉低价格,只能继续扩张算力、建造数据中心,而这需要巨额投入。收费并非某个产品的商业策略,而是整个行业从免费圈地走向按实际消耗回收成本的必然。
技术并不新鲜,但能力分层正在加速
从公开资料看,这套技术从学术讨论到产品爆发仅用了不到十年。今天的智能助手能生成代码、整理文档、分析表格、美化图片,甚至连续执行多步任务,仿佛全新的物种。然而拆开来看,所谓大模型本质上仍是基于海量数据学习模式的预测系统,其核心原理十年前就已存在。
真正的变化发生在“怎么用”这一层。从写好一个 prompt,到设计一套上下文工程,再将个人方法论封装进 CLAUDE.md、AGENT.md,进而搭建出可复用的 harness,每一步都不是技术本身的突破,而是人把工具吃透后展现出的熟练度。再往上,便是 vibe coding、agent loops 与持续探索:你不再只是“向它提问”,而是“设计一套让它持续交付的工作流”。差距正是由此拉开。
常见技能阶梯
- 第一层:会对话。打开页面就能提问,收到基本回答。
- 第二层:会调教。能借助提示词、上下文约束与工具调用,让它稳定输出工作水准的结果。
- 第三层:会搭 harness。将流程、规则、模板与个人经验封装为可复用体,训练出专属的“外脑”。
从“提示词”到“上下文工程”
早期人们强调“写好提示词”,但“prompt engineering”一词在2025年后已被从业者刻意淡化。并非它不再重要,而是它已变得如同写字一样基础,无需专门冠名。
新一代提法叫“上下文工程”。它要求的不只是你写对一句话,而是把任务目标、参考资料、输出要求、校验标准、迭代方式打包成一条稳定的执行管道。换言之,你原本在脑内“准备上下文”的隐性工作,如今要显式地写成结构化规则,让智能工具按预期运行。
对普通人而言,最友好的切入点仍是提示词。世界经济论坛《2025年未来就业报告》明确指出,近40%的核心工作技能将被生成式方法改变,而“新读写能力”正是最底层的一项:会筛选信息、拆解任务、借助辅助工具将想法变为成果。
将个人方法封装成专属 Harness
真正让工具从“能帮你”变成“你用得顺手”的,是你自己的 harness。这个词听起来像开发术语,但本质是把做事流程打包封装:你的判断标准、常用资料、成品格式、质量检查步骤,都写成可重复执行的规则。
Build / Test / Iterate,这是工程师的节奏,对普通人同样适用:先搭建最小可行版本,用真实任务测试,再根据结果调整。你会发觉,不是模型变聪明了,而是你更懂得“指挥”它了。
CLAUDE.md、AGENT.md 这类文件,就是你写给自己的一份“使用说明书”:在特定场景下要遵守哪些原则,哪些是禁止触碰的红线,输出达到什么标准才算完成。它们实质上是经验的固化,并非神秘的咒语。
Vibe Coding、Loops 与持续探索
如果你已能稳定让工具完成单项任务,下一步加码的路径就是 loops:把“生成→检查→修正→重跑”串成自动循环。写代码的人如今管这叫作 vibe coding,意思是描述你的“感觉”和大方向,由模型处理琐碎实现,你只判断“方向是否对头”。
Claude Code 之父 Boris Cherny 深度解读:编程已死还是重生?
2026 年 5 月 6 日,红杉资本 AI Ascent 大会上,Claude Code 的创建者 Boris Cherny 走上舞台,向现场观众抛出一个问题:
“有多少人 100% 手写代码?有多少人 100% 用 AI 写代码?”
两极各有少数,中间占大多数。Boris 笑了笑,甩出一句震撼全场的话:
“对于我个人而言,编程已经被解决了。从去年 10 月、11 月开始,模型就已经能写出 100% 的代码。”
此言一出,开发者社区瞬间炸锅。有人质疑他只是 Anthropic 的“活体广告”,也有人觉得这不过是“AI 将取代程序员”之后又一件“皇帝的新衣”。
但我将 Boris 在红杉大会上的演讲、YC 圆桌访谈、他在 X 上发布的长文,以及 36 氪的专访全部研读一遍后,发现事情远比“编程已死”这个耸动标题要复杂得多。
Boris 并非夸大其词。但他讲述的现实,也并不代表大多数开发者的日常。
先看看这位“不写代码”的人,实际在做什么
Boris 的个人数据确实令人震惊:
| 指标 | 数据 |
|---|---|
| 2026 年至今手写代码 | 0 行 |
| 日均合并 PR | 数十个 |
| 单日最高 PR 数 | 150 个(主动测试上限) |
| 主力开发设备 | 手机(iOS Claude 应用) |
| 同时运行的 Agent 数量 | 数百个 |
| 每夜深度异步 Agent 数量 | 数千个 |
数据来源:红杉资本 AI Ascent 2026 Boris Cherny 演讲
Claude Code 自然语言驱动 Blender 建模:MCP 插件安装全攻略

安装完成后,您就能在 Claude Code 桌面版中用日常对话的方式指挥 Blender 自动完成建模任务——这意味着从构思到渲染的创意全流程都将变得像聊天一样自然。
教程源自:Blender 官方 MCP 服务页面与 GitHub 开源项目 ahujasid/blender-mcp,目的是让 Claude Desktop 能够通过标准化协议直接操控 Blender,把自然语言转化为精确的建模指令。
安装前的系统检查
请依次确认以下三项已准备就绪:
① Blender 5.x(已安装 ✓)
② Python 3.10 或更高版本
在终端执行 python3 --version 检查
预期输出类似 Python 3.10.x 或更高
如需升级请访问 https://www.python.org/downloads/
③ uv 包管理器
Mac 终端运行:brew install uv
若未安装 Homebrew,请先执行:
/bin/bash -c "$(curl -fsSL https://raw.githubusercontent.com/Homebrew/install/HEAD/install.sh)"
完成后验证:uv --version
第一步:为 Blender 安装 MCP 插件
方式 A:官方拖拽安装(Blender 5.x 推荐,支持自动更新)
需要分两次拖拽,分别添加仓库和安装插件:
首次拖拽 → 注册 Blender Lab 源:
① 访问 https://www.blender.org/lab/mcp-server/
② 找到页面中的 “Install in Blender” 按钮
③ 用鼠标将该按钮或链接直接拖拽到已打开的 Blender 窗口内
弹出的确认框中点击 OK
第二次拖拽 → 安装插件本体:
④ 重复上一步的拖拽操作
在出现的安装确认窗口中点击 OK 或 Install
方式 B:手动下载并加载插件
① 打开 https://github.com/ahujasid/blender-mcp
② 在页面右侧 Releases 区域下载最新版的 addon.py 文件,保存至桌面
③ 启动 Blender,通过顶部菜单进入 Edit → Preferences(或按 Ctrl + ,)
④ 在偏好设置左侧选择 Add-ons(插件)选项卡
⑤ 点击右上角 Install... 按钮,在弹出的文件浏览器中选中 addon.py
随后点击右下角 Install Add-on
⑥ 在插件列表中找到 “Interface: Blender MCP”
勾选它左侧的复选框,确保该项高亮显示(已启用)
⑦ 关闭偏好设置窗口即可。
第二步:在 Blender 中启动 MCP 服务器
Claude Fable 5评测:断代领先的编程模型,价格却低于预期
今天必须以“震撼”开场,因为这是一款断代领先同行的模型,而且价格远没有想象中昂贵! 程序员和知识工作者的工作模式即将迎来巨变。
这次发布的模型没有被称作“神话 Mythos”,而是取名为“寓言 Fable”!
未来世界的神话,始于今日的寓言。
这件事注定会刷屏,我们先来看看官方公布的第一手消息。Claude系列正式迈入5.0时代。

Claude 是 Anthropic 旗下的大模型系列产品。
Claude 官方推文只有两句话:
推出 Claude Fable 5:一款神话级模型,我们已为其添加安全护栏,面向一般用户开放。
它的能力超越了我们此前任何公开可用的模型。
第一句点明新模型名为 Claude Fable 5,达到了 Mythos 级别的实力,并且套上了保护框架。
第二句指出能力超越了 Claude 以往所有模型,实际上可以去掉限定词——它超越了全球所有模型!
为什么敢这样说?请看第二条推文:
Fable 5 在几乎所有测试基准上均处于最先进水平,在软件工程、知识工作、科学研究和视觉领域都表现突出。任务越发长且复杂,Fable 5 相较于我们其他模型的优势就越大。
同时附上了这张基准对比图:

看到这张图确实令人头皮发麻。奥特曼看了恐怕都会瘫坐沙发,就像目睹原子弹爆炸一样。
这一次绝对不是夸张!
先看“智能体编程”类别中的 SWE-Bench Pro 基准。
“寓言” Fable 5 得分 80.3%,而预览版“神话” Mythos 5 为 77.8%。
也就是说,今天发布的寓言,比之前亮相的神话还要强悍。
在同一指标上:
Claude Opus 4.8 仅 69.2%
GPT‑5.5 仅 58.6%
Gemini 3.1 Pro 仅 54.2%!
要知道编程本身难度极大,Pro 基准又是高难度专业基准。在这样的专业测试中,居然能实现对前代与同行的断代式超越。
这是何等恐怖的实力!
智能体编程的第二项 FrontierCode,同样翻倍领先前代和 GPT‑5.5!