智谱GLM-5.2发布:1M超长上下文+MIT开源,AI编程模型迈入全仓库时代

短短四个月,智谱接连推出GLM-5、GLM-5.1与GLM-5.2,完成了三代旗舰模型的快速迭代。最新版本聚焦两个核心数字:1M上下文窗口与MIT开源许可。它们共同传递一个信号:开发者可以自由使用、修改和部署,没有任何上限。
一则社交动态,引爆关注
6月13日,Z.ai官方账号发布了一条极其简短的动态。没有预热情感渲染,没有直播发布会,仅仅几段文字和一个链接,却概括了所有重磅信息:GLM-5.2向GLM Coding Plan全体用户开放,支持1M上下文,编码能力显著增强,API和聊天机器人下周上线,模型以MIT协议开源。动态结尾的那句话尤其值得回味——「AI的未来是开放的,它属于人民。」
GLM Coding Plan是智谱专为AI编程场景设计的订阅服务,覆盖Lite、Pro、Max、Team四个级别,兼容Claude Code、OpenClaw、Cursor等主流开发工具。此次升级让订阅用户无需额外配置,即可无缝切换至5.2。这条动态迅速引发热议,收获了124条回复、2467个点赞和17万次浏览。
从20万到100万Token:上下文窗口的质变
梳理智谱2026年的模型迭代时间线:2月推出GLM-5,采用745B参数MoE架构,上下文长度200K,SWE-bench Verified得分为77.8%,并以MIT协议开源。4月GLM-5.1发布,长程任务处理能力大幅强化,在SWE-Bench Pro基准上夺得当时开源模型的SOTA。到了6月的GLM-5.2,上下文窗口从200K直接跃升至1M,完成了一次数量级的跨越。
200K到1M并非简单的数值倍增。长上下文处理是当前大模型竞争的硬骨头,注意力机制需要在五倍长度的序列上维持精准度,同时不拖垮推理效率,控制显存消耗。早在GLM-5时代,智谱就已采用DeepSeek Sparse Attention实现稀疏注意力优化,5.2版本能将上下文拓展至1M,表明其在长序列训练与推理优化上获得了实质性突破。
对于开发者而言,这等于可以把整个代码仓库“喂”进上下文窗口。一个拥有数十万行代码的中型项目,连同相关的Issues、技术文档和设计稿,都能在一次请求中处理完毕。无论是复杂的系统重构、跨模块联合调试,还是大规模代码审查,1M上下文窗口构成了这些高阶编程场景的“分水岭”。
MIT许可证:无门槛的开放生态
MIT是目前最宽松的开源许可证之一,它允许商用、二次修改与再分发,唯一的硬性要求是在分发时保留原始版权声明。对于一家商业公司而言,这几乎等同于毫无保留的开放。智谱从GLM-5开始就坚定地选择了MIT许可,GLM-5.1与GLM-5.2延续这一策略,每一版模型权重均可在HuggingFace和ModelScope上自由下载。
明确的受益方随之浮现。中小型企业或团队可以下载模型进行私有化部署,摆脱对外部API的依赖,消除数据外泄的担忧。对于金融、医疗等合规监管严格的行业,开源模型成了进入AI编程领域的“通行证”。在受NVIDIA出口限制影响的地区,GLM-5系列还支持在华为昇腾NPU上运行,这一硬件适配进一步拓宽了前沿模型的可及范围,让更多开发者受益。
GLM Coding Plan的订阅定价本已具备很强的竞争力。输入成本为每百万tokens 1美元,输出为3.2美元,大幅低于GPT与Claude的价格。配合MIT开源,企业相当于手握双选项:既可依据需求调用API,也能直接下载模型自托管,决策权完全交还到开发者手中。
三代更迭,一脉相承的开放路线
将GLM-5、5.1、5.2三者并置而观,智谱的迭代路线显得十分透彻。每一代都沿着两条主线演进:拓展上下文边界,深化编码能力。从200K到1M,是量变酿成质变的过程;从SWE-bench评测到长程Agent任务,再到全仓库级上下文,每一代产品覆盖的工程场景都在持续扩大。
开源绝非跟风的市场营销。三代旗舰模型全部采用MIT协议,每一版都可以下载、商用和私有化部署。面对这样的持续输出,那些仅开源过时版本或只放出蒸馏小模型的公司相形见绌,格局高下立判。
工具链的广泛兼容筑起了另一道实用壁垒。GLM Coding Plan全面适配Claude Code、OpenClaw、Cursor等主流开发环境,用户无需学习新IDE或命令行工具。将迁移摩擦压低,有时比单纯的性能指标更容易撬动大规模采用。
GLM-5.2的API服务和开源模型权重将在下周正式开放。对于正处于编程模型选型阶段的团队而言,这两个节点值得并行追踪。
竹构穹顶跨文化实验:前哥伦布宇宙屋的当代转译


一座圆锥形竹构穹顶,隐入哥斯达黎加诺萨拉的山坡。远远望去,仿佛地面自然隆起的部分,除了屋面木瓦的纹理和那道微微起伏的轮廓线,几乎察觉不到建筑的响动。它并非“巴厘岛风情空投中美洲”的猎奇项目,值得被记住的理由,在于它同时回应了三个更深层的建筑学追问:前哥伦布时期的形式原型如何在今天摆脱主题公园式的拟真?来自三个大洲的竹材怎样同构于同一套构造逻辑?巴厘岛的竹构手艺,又如何移栽到一片毫无竹建造传统的工地上?
#竹构穹顶 #前哥伦布 #跨文化建造
观察:这是一座仅120平方米的竹构穹顶,形式源自哥斯达黎加前哥伦布时期的“宇宙屋”,结构体系由巴厘岛的IBUKU带入,具体建造则交到当地木匠手中。
判断:Maloca展示了一个三层“适应”同时发生的建造现场——形式适应当地的文化原型,材料适应当地的可得性,手艺则适应本地工匠已有的经验储备。
可信来源:CLADmag 2025 H2 / Architizer 2026

远景中的Maloca穹顶:圆锥形态与山体轮廓融为一体,屋顶木瓦的质感消解了建筑的体积感。摄影师:James Wolf
形式转译:宇宙屋何以拒绝主题公园
Maloca的圆锥形不是随意勾勒的。LOOP团队做场地研究时,挖掘出哥斯达黎加前哥伦布时期原住民建筑中的一种叫做“宇宙屋”(cosmic house)的圆锥形房屋。那是当时居民宇宙观的物质凝结:锥尖朝上,对应天空;圆形平面象征大地;室内不设锐角,也不做隔墙。真正动人的,是它的建筑学诚实——一个单一空间,一个屋顶,再无赘余。


LOOP与IBUKU并未选择复刻其外观。那样只会造出一个主题公园里的“原始村落”。他们提取了两个结构特质:圆锥几何与中心指向性,并用当代竹构工程重新表达。圆锥几何一举解决了两个设计难题。其一,陡峭的屋顶坡度让木瓦面排水极快,非常适合热带山区的暴雨模式;其二,锥体在风荷载下的表现远胜于平顶或缓坡屋面,这对暴露在山脊上的场地而言至关重要。IBUKU的Lucas Schlüter坦白,哥斯达黎加山地的风速比他们在巴厘岛所习惯的水平高出很多,结构体系必须重新考量。
中心指向性服务于功能,而非神性。圆形的瑜伽厅不设任何柱子——柱子被退到环形走廊,视线自然汇向圆心。然而圆心处并没有祭坛,视线直接穿过开口,落向山坡的景观。宇宙屋的神圣感来源,被从宗教转移到自然中。

剖面图:显示圆锥几何、室内无柱空间与环形走廊的柱列关系。圆形瑜伽区与外围动线形成明确动静分区。

总平面:穹顶占据山脊高处,背后一棵大树被保留为视觉锚点。圆锥形态与山脊线并不冲突。
三种竹材的协同:从结构到视觉秩序
Maloca的结构体系实行的是一种材料层面的“分治”。主要结构支撑采用哥斯达黎加本土的Guadua Angustifolia。这种竹子以杆身通直著称,最大可用长度可达12米,抗压强度约571.9 kg/cm²,接近结构混凝土的水准。竖向杆件帮助实现“屋顶漂浮”的视觉效果:柱子像是将屋顶轻轻托起,而非向下压覆。
Atelier One的工程师为Maloca设计了倾斜柱系统(leaning columns)。环形走廊的柱子向外倾斜,在地震和风荷载作用下,通过微变形来吸收能量。这正是竹结构独有的“以柔克刚”的抗震策略。1991年Limón地震中,Tierramor所在地区的用Guadua建造的房屋,在烈度MMI IX下完好无损地幸存,为这一策略提供了有力的验证。
吊顶则采用从印度尼西亚进口的Gigantochloa Atroviolacea(紫杆竹,俗称黑竹),色泽深黑近墨,与浅金黄的Guadua形成鲜明的视觉对比。这种黑色竹材在IBUKU的巴厘岛项目中已被反复验证为稳定耐久的室内用材。深色吊顶的实际功用,是消解顶部空间的边界感。当人的视线被引向铜质顶饰时,深色的背景让锥顶显得比实际高度更加高远,这在120平方米的小尺度空间里极为关键。
钢环梁的存在,是最诚实的构造声明。在屋顶椽子的交汇处,IBUKU并没有强求竹制环梁——当地木匠缺乏制作竹制复杂节点的经验。改用钢环梁后,结构安全有了保障,钢构件又被深色竹吊顶吸纳,视觉上毫不突兀。这一材料替换本身,就是对“适应性”在建造层面最直接的注脚。地面与墙裙用的是Tierramor的红土,来自场地本身的红色黏土,夯实成墙。挖基础时掘出的土,由此转换为界定空间触感的材质。

室内:深色黑竹吊顶与浅色Guadua结构柱的色差关系,铜质顶饰成为视线终点。

环形走廊与倾斜柱列:柱子向外倾斜,营造动态的行走体验,同时处理风荷载问题。

屋面与天光:木瓦覆盖的锥顶,铜质收边件成为唯一非自然材料的视觉焦点。
手艺迁移:巴厘岛竹匠遇上哥斯达黎加木匠
IBUKU在巴厘岛积累了逾15年的竹构经验,团队与当地竹匠之间早已形成一种靠长期协作磨合出的手艺默契——一种几乎不需要施工图就能传递设计意图的沟通方式。但到了哥斯达黎加,这套默契失去了载体。
接手建造的本地木匠从来没有用竹子盖过房子。他们的手艺传统是木框架,工具是锯子和钉子,解决问题的方式与竹材几乎完全不同。竹子要求你理解纤维的生长方向、含水率变化对节点的影响、以及连接方式的独特逻辑。Lucas Schlüter的做法是“以简驭繁”:在复杂节点处改用工匠熟悉的材料(钢环梁),在非关键部位则保留竹构工艺,让工人们边做边学。这是一种逐层降级的策略——结构关键节点不冒险,围护和装饰节点保留教学价值。工匠们从最初的谨慎、怀疑,慢慢到掌握材料特性,甚至开始主动提出节点优化的方案。
这段经历的价值并不在于“巴厘岛技术的成功出口”,而在于它揭示出跨文化建造的一个基本条件:项目设计本身必须为学习与试错预留空间。设计图纸留白的地方,恰恰也是学习生长的地方。

施工中的Maloca:竹骨架组装过程,倾斜柱与基础连接节点清晰可见。
可迁移的实践:三条转译
- 选择圆锥几何的同时,就顺带回应了排水和风荷载。一个形式操作同时解决两个结构问题,这样的形式才真正值得做。
- 跨文化建造中,要分清“必须坚持”与“可以适应”:环梁从竹换成钢,结构安全没有妥协;竹天花保留印尼黑竹,视觉体验没有妥协。妥协的是工艺路径,不是性能目标。
- 场地材料不只是“用本地石头”那么简单;挖出来的土夯成墙,是成本最低、碳足迹最小、场所感最强的材料策略。红土来自脚下,也从此定义了空间的性格。
来源
LOOP Design Studio https://www.loopdesign.studio/maloca
Lucas Schlüter, “Back to the land”, CLADmag 2025 H2
2026年6月国产旗舰模型API定价深度对比:谁才是性价比之王?
2026年6月最新旗舰模型定价对比与性能梯队排名已出炉,这里全面梳理了当下国产大模型的API按量付费价格,并结合能力表现,呈现一个从“夯”(实惠强劲)到“拉”(高价低效)的主观梯队。
AI编程模型迭代飞快,价格战与能力战相互交织。本次盘点覆盖的最新旗舰模型包括:MiMo-V2.5、DeepSeek-V4-Pro、MiniMax M3、Kimi K2.6、GLM-5.1、豆包 2.0 Pro、Qwen3.7-Max、Hy3 preview、Step-3.5-Flash 等。
国产主流模型 API 定价最新对比(2026年6月)

价格极端值一览
| 项目 | 最便宜 | 最贵 |
| 缓存命中输入 | 小米/DeepSeek Flash 0.02元 | GLM-5.1 1.30元(贵65倍) |
| 缓存未命中输入 | 豆包Lite 0.60元 | Kimi K2.6/GLM-5.1 6.50元 |
| 输出 | 小米/DeepSeek Flash 2.00元 | Kimi K2.6 27.00元(贵13.5倍) |
| 典型编程混合均价* | 小米/DeepSeek Flash ≈1.29元 | Kimi K2.6 ≈12.36元 |
*典型编程场景:输入5万tokens(未命中)+输出2万tokens,混合均价=(5×输入+2×输出)/7
从“夯”到“拉”的定价+能力综合排名

*典型编程混合均价=(5×缓存未命中输入+2×输出)÷7,若模型未提供缓存未命中价则用缓存命中价代替。
一句话总结
纯粹追求性价比:小米/DeepSeek Flash版最为“夯实”,每百万token成本仅需约1.29元;若愿为顶尖能力支付溢价:DeepSeek Pro版综合均衡;而GLM与Kimi在按量付费上目前最显“拉胯”,若长期使用不妨考虑转向官方Plan套餐以获得更优单价。
2026年智能宠物自动喂食器DTC选品深度指南:市场变局、产品缺口与品牌破局路径
一、全球市场机遇与增长驱动力
全球自动及智能宠物喂食器赛道正在经历爆发式增长。根据 Global Growth Insights(2026 年 1 月) 的统计,2025 年全球市场体量已达 20.9 亿美元,预计 2026 年将升至 26.1 亿美元,到 2035 年更有望膨胀至 195.8 亿美元,预测周期(2026-2035)的复合年增长率高达 25.1%。其中,具备 WiFi 与 App 连接能力的智能喂食器约占据 55% 的份额,CAGR 约为 27.8%,其增速明显高于传统自动喂食器。
SkyQuest 及 GII Research 等研究机构也得出了相似的判断:2024 年 244 亿美元→2033 年 942 亿美元,对应 CAGR 约在 14.3% 至 16.2% 之间。各家机构 CAGR 的差异主要源于对“智能”定义的边界不尽一致,但方向高度统一——均指向双位数的强劲增长。

核心驱动力拆解:
宠物家庭化与拟人化趋势
:APPMA 2025 报告显示美国宠物拥有户数已达 9400 万(覆盖 66% 的家庭),千禧一代(33%)成为养宠规模最大的群体,Z 世代则是增长最快的力量。
远程喂食的刚性需求
:63% 的职场宠主难以维持规律喂食(Global Growth Insights),远程投喂成为痛点。
精准健康管理诉求
:52% 的购买者将份量控制与体重管理视作重要考量。
智能家居生态融合
:48% 的用户重视与智能家居的连接,56% 的用户偏爱 App 控制型产品。
2026年智能桌面饮水机跨境选品深度报告:蓝海市场、用户痛点与DTC品牌破局策略
市场全景透视
全球智能桌面饮水机市场正以惊人速度扩张。根据Verified Market Reports的最新数据,2025年该市场规模已经攀升至30.8亿美元,并有望在2033年跃升至52.3亿美元,复合年增长率(CAGR)高达9.2%。放眼整个饮水机产业,GII Research报告显示2024年全球总规模为31.8亿美元,预计2030年将达到52.3亿美元,CAGR为8.6%。这些数字背后,隐藏着巨大的跨境商机。
增长的核心引擎
- 健康饮水意识激增:后疫情时代,消费者对水质安全的关注持续升温,调查表明已有35%的新上市饮水机产品集成了数字化监测功能(Business Research Insights数据)。
- 智能家居生态融合:物联网联接实现了远程操控、实时溶解性总固体(TDS)追踪、滤芯寿命预警等能力,已经成为产品差异化的决定性要素。
- 告别瓶装水运动:直连水管或内置水箱设计有效降低塑料浪费、节约空间,完美契合环保理念与现代极简美学。
- 多温段即时出水成为标配:从4°C的冷水到100°C的沸水,多段精准温控配合3秒即热技术,可满足冲奶、泡茶、冷饮等各类场景。
区域市场格局
| 区域 | 2025年规模 | 2033年预测 | 复合增长率 | 全球占比 |
|---|---|---|---|---|
| 亚太 | $130亿 | $280亿 | 8.2% | 38% |
| 北美 | $210亿 | $340亿 | 5.8% | 26% |
| 欧洲 | $120亿 | $200亿 | 6.1% | 21% |
| 其他地区 | $48亿 | $83亿 | 7.0% | 15% |
数据来源:Verified Market Reports(2026年5月更新版)、Grand View Research、Business Research Insights。亚太市场增速领跑全球,其中中国的年复合增长率高达9.0%;北美则是体量最为庞大的成熟市场。
竞争格局研判
眼下市场的竞争版图呈现出“哑铃型”结构——低价位纯过滤产品(50至80美元)与高端反渗透全功能机型(500美元以上)厮杀激烈,而在150-250美元的中端智能区间,仍存在显著的品牌真空地带。
| 品牌/型号 | 价格区间 | 亚马逊评分 | 过滤层级 | 核心卖点 | 主要短板 |
|---|---|---|---|---|---|
| Waterdrop A1 | $529-649 | 4.0★ | 7级RO+UV | 即热即冷、OLED屏、100GPD、双UV杀菌 | 体积偏大(18英寸深)、水箱仅3.1L、滤芯年费约$130 |
| SimPure Y7P-BW | $280-330 | 4.3★ | 4级RO+UV | NSF 58认证、免安装、100GPD | 无压缩机制冷、运行噪音偏高、废水比2:1 |
| Bluevua RO100A | $230-280 | 4.2★ | 6级RO+UV | 玻璃水瓶、可视化过滤、免安装 | 无即时冷热功能、出水速度慢、不支持APP |
| Avalon B8BLK | $200-250 | 4.4★ | 2级碳滤 | 非接触感应、三温模式、UL认证、无限供水 | 必须连接水管、仅2级过滤缺少反渗透、无智能功能 |
| Brio Moderna | $220-280 | 4.3★ | 3级+UV自洁 | 3级过滤、UV自洁、LED夜灯、Energy Star认证 | 需要水管安装、无APP操控、无RO深度净化 |
| Brita Hub | $50-60 | 4.1★ | 碳块滤芯 | 去除70余种污染物、机身紧凑、6个月滤芯、BPA-free | 没有冷热功能、仅9杯容量、不支持智能互联 |
| Primo 601130 | $120-180 | 4.2★ | 无内置过滤 | 三温供水、不锈钢材质、LED指示灯、ENERGY STAR | 依赖桶装水、无过滤、无智能功能 |
| hOmeLabs Tabletop | $170-220 | 4.3★ | 无内置过滤 | 压缩机制冷、三温、紧凑设计、Energy Star | 需使用瓶装水、零过滤、无智能模块 |
用户痛点深度拆解
针对亚马逊消费者差评的专项分析,揭示了现有产品最致命的几大缺陷。其中,漏水/渗水问题以36.8%的占比高居首位,成为行业最大的信任黑洞。
360龙虾教练实测:10分钟打造你的专属AI内容专家,告别AI味
内容创作专家入驻360
一位名为“冷逸”的AI内容专家刚刚正式入职360安全龙虾云端版。他能够独立完成内容创作,自带独特的lengyi-write文风,全程使用流畅人话,彻底杜绝机器味。尤其擅长AI领域的深度产品观察、模型评测和行业分析,交付的信息像人一样自然。

产品首页还陈列着更多联名专家虾,可直接调用。
先看看他的一篇作品——《Claude Opus 4.8最全信息整理》,整体表现如何?

(可上下滑动,查看全图)
整篇内容信源几乎全部来自官方,并且进行了交叉验证。作者明确说明这不是实测,未亲测不妄下判断,仅为信息梳理,偏向事实清单。结构遵循“先给结论 → 速览表 → 正文 → 写在最后”,保持了作者一贯的写作调性。

训练过程一手拆解
下面为你详细拆解这个内容专家的设计方法。
最近,360安全龙虾云端版上线了「龙虾教练」——一个专门帮助用户快速训练专属龙虾的龙虾。简单来说,它是一个训练龙虾的引导式智能体。
如果要创建一个专门负责内容创作的龙虾专家,只需输入需求和要求。

龙虾教练会通过连续对话确认需求。

需要确认的内容包括Agent名称、用户名、Agent效率、使用场景、文风、反思机制以及禁止事项等。你不必自行撰写提示词,而是像做选择题一样快速“训练”这只龙虾。
充分沟通需求后,它会输出一版行业调研结论等待你的确认。

其中包含对龙虾的岗位要求、风险设置、Skill生态和合规要求。你可以直接确认,也可以用口语化命令让教练修改。
随后进入架构设计环节。

(可上下滑动,查看全图)
这是Agent设置的关键,涵盖基础档案(Profile)、角色与灵魂设定、用户场景、工作方法论等。
确认架构后,系统开始配置龙虾。

配置生成后,点击“使用该版本”,所有配置就自动同步到右侧的可视化面板。

在这里可以手动调整基本信息、skill配置、工具配置,确认无误后点击“完成”。
不到10分钟,专属的内容专家龙虾就训练完成。下面跑一个真实任务看看效果。

它支持多种模型选择,写作任务首推DeepSeek-V4和Qwen3.7-Max,编程任务推荐K2.6、GLM-5.1、M2.7和Qwen3.6-plus,日常对话推荐M2.7和GLM-5.1。

调用「冷逸文风」专家运行一次,就得到了开篇展示的那个作品。
目前,这个龙虾专家已经上架到360安全龙虾云端版的「联名龙虾」区,所有人均可直接使用。

除了这个内容专家,产品推荐中还有更多联名专家龙虾,比如藏师傅、花叔等,都可以一键调用。

更多现成龙虾和模型支持
除了自己训练,平台上已经封装了大量可直接使用的龙虾,例如Claude Code专家、Image-2视觉专家、Seedance 2.0视频专家、创投情报分析师、六顶思考帽思维导师等。
关于文章配图的制作方法,其实正是利用了Image-2。

现在,在360安全龙虾上就能直接调用它。

使用提示词参考:请提炼下面的内容生成信息图(精简文字)
执行后,就能得到这样的信息图。

除了单Agent专家,平台还提供了许多Multi-Agent专家团,实现多智能体协同工作。

例如“全球CEO智囊团”非常有意思。向它提一个问题,并配上最强的Qwen3.7-Max模型。

系统会调度多个专家同时工作。

最终答案如下面的视频所示。

分析结论相当靠谱,不过,看完后可能会对开民宿的信心造成一定打击。
还有一个非常有趣的功能点:360安全龙虾能够自由切换运行模式,分为轻量、省钱、满血三档,丰俭由人。

轻量模式相比原版OpenClaw可节省90%的Token,适合日常聊天;省钱模式节省70%,是写报告、做分析、内容创作的最佳选择;满血版则专门应对复杂任务。
3天烧掉820亿Tokens!MiMo与Opus组合拳实战全攻略
3天烧掉820亿Tokens!MiMo与Opus组合拳实战全攻略
前脚刚把 MiMo 送的 16 亿配额磨掉 25%,早上一刷新,账户余额直接拉满到 820 亿——这数字膨胀得我数零都数了好几遍,恍惚间甚至想问问能不能折现成人民币!

这波操作属实离谱,数字一个比一个夸张。
更劲爆的是,MiMo 同步宣布了 API 永久降价,降幅高达 99%!

具体的细则还没来得及深究,但第一反应是:这是冲着 DeepSeek 那个永久 2.5 折去的吧?两家明显在较劲啊。
话又说回来,不管动机是什么,对用户而言都是实打实的利好。卷价格、卷规模、卷能力,这种行业竞赛越多越好!
唯一的遗憾是,这个月就剩三天了……额度重置加上 N 倍叠加,这波操作的时间窗口真叫人哭笑不得。

虽说是“纯度”不高的 Tokens,但这个体量摆在这儿,实打实地能用。问题随之而来——三天时间,820 亿到底怎么烧?
上一次我分享过一个思路:去问不同的 AI,怎样才能快速耗尽 Tokens。后来我按照它们的建议做了一个武侠知识库《江湖百晓生》,不过 MiMo 生成的版本效果一般,没能用起来。
接着我又另辟蹊径,做了一个文档网站——把 Claude 的整套 API 文档全部拉取到本地,然后让 MiMo 翻译成中文文档。

这个方案消耗 Tokens 的效率非常高,而且 MiMo 的翻译质量居然还过得去,比起硬啃全英文原始文档舒服太多了。

今天就重点复盘这个实战场景,顺带记录一下我是如何利用 Opus 4.7 + MiMo 这套组合拳来搭建整个网站的。
核心思路很明确:优质 Tokens 攻坚,普通 Tokens 铺量,二者各司其职,一个子儿都不浪费。
一、Opus 主攻高难度任务
第一步,让 Opus 啃掉最硬的骨头——网站分析、内容抓取、架构搭建。
先看一眼 Claude 官方文档站点:

整个网站数据体量不小,基本是全英文状态。虽然官网提供了中文选项,但翻译覆盖度差得远,不少页面残缺不全。
820亿Credits能兑换多少Tokens?小米MiMo套餐价值深度拆解
一、820亿Credits从天而降,但多少Tokens才靠谱?
一觉醒来,账户里凭空多出820亿——是小米MiMo赠送的Credits!这消息让我立刻奔走相告。
不过,很多朋友提醒:Credits不等于Tokens,别高兴太早。
我当然知道它们不一样。可核心问题摆在这儿:
- Credits和Tokens的换算比究竟是多少?
- 820亿Credits到底对应多少Tokens?
- 买Token Plan相比直接调用API到底省了多少?
- 为什么别人家的Credits只有几千到几万,小米一出手就是几百亿?
虽然暂时没搞清具体关系,但这820亿的数字,总让我想起津巴布韦币那种“数零”的迷幻感。于是我专门跑到官方站点,扒来了几组关键数据。
1. 关键截图
我一共收集了三张图表:
API价格表

Credits消耗明细

套餐价格

下一步,把这三张图交给AI,让它帮我抽丝剥茧。
二、让GPT-5.5试试水
先把前两张图丢给GPT-5.5 Thinking,得到的总结如下:

它甩出的结论是1元 = 100 Credits,我差点就信了。但转念一想,按这个比例,820亿Credits岂不就是8.2亿元?咱们掏几百块买一个月的Max套餐,小米白送价值8个亿的Credits,这可能性几乎为零。
三、更严谨的推导交给Opus4.7
于是,我把三张图片全部输入Opus4.7。
它承认小米这套定价逻辑确实绕人,然后一步步把换算关系理清楚。
核心换算关系
从图2可以直接反推Credit的单价。以MiMo-V2.5-Pro为例:
- API定价:输入未命中缓存 ¥3.00/百万tokens
- Credits消耗:300 Credits/token = 3亿 Credits/百万tokens
所以,¥3.00 = 3亿 Credits,换算下来 1元 = 1亿 Credits,也就是 1 Credit = 0.00000001元。
再用其他模型做交叉验证:
| 模型 | API输入未命中价格 | Credits消耗 | 换算结果 |
|---|---|---|---|
| MiMo-V2.5-Pro | ¥3.00/M | 300/token = 3亿/M | ¥1 = 1亿 Credits ✓ |
| MiMo-V2.5 | ¥1.00/M | 100/token = 1亿/M | ¥1 = 1亿 Credits ✓ |
| MiMo-V2-Pro | ¥7.00/M | 700/token = 7亿/M | ¥1 = 1亿 Credits ✓ |
| MiMo-V2-Omni | ¥2.80/M | 280/token = 2.8亿/M | ¥1 = 1亿 Credits ✓ |
结论一致:1元人民币 = 1亿 Credits。
AI编程智能体撞脸实录:Codex与Claude Code功能趋同全景解析
一、一张时间线图,揭开AI编程圈"双胞胎"的秘密
2026年6月初,开发者 Elie Bakouch 在 X 平台抛出一张令人瞩目的对比图。
这幅信息图绘制了从2025年2月绵延至2026年6月的时间轴,将 Claude Code 与 Codex 的相似功能逐一锚定在发布时间坐标上。橙色标记归属 Claude Code,蓝色则代表 Codex。
每一行条目都是双方共享或高度近似的功能:/goal指令、子智能体系统、上下文压缩机制、沙箱环境、技能库模块、dreaming 记忆引擎……
这张功能图谱在开发者社区激起层层涟漪,因为数据结论犀利到令人无法忽视:
| 统计维度 | 数据 |
|---|---|
| 共有相似功能 | 24项 |
| Claude Code 先发 | 18项 |
| Codex 先发 | 4项 |
| 存在争议 | 2项 |
18:4的悬殊比例。 橙色(Claude Code)几乎覆盖了时间轴的前半段版面。
Elie 并非凭印象论断。他交叉核验了 npm 发布记录、GitHub Release 日志和官方技术博客,逐条考据了每一项功能的首次亮相时间。
来源:Elie Bakouch 的 X 帖子及 GitHub Gist,36氪/新智元 2026-06-08 报道
二、11天——新功能的领先窗口正以"天"为单位消失
18:4 的统计已足够触目惊心。但更让人心头一紧的是追赶加速度。
Codex 率先推出的4项功能
身为后来者的 Codex(Claude Code 2025年2月推出,Codex 编程智能体同年5月才亮相),同样拥有原创时刻:
| 功能 | Codex 先发时间 | Claude Code 追平时间 | 追平耗时 |
|---|---|---|---|
| 内置沙箱 | Codex 早期优势 | Claude Code 后续跟进 | — |
| 云端异步智能体 | Codex 率先推出 | — | 仍处于领先 |
| 目标模式(Goal mode) | Codex 首发 | Claude Code 实现对齐 | 11天 |
| 多智能体并行 | Codex 先发 | Claude Code 跟进实现 | 11天 |
发现了没?区区11天。
AI陪伴三年终出优质产品:叠叠社悬浮弹幕引擎深度测评,技术硬核如何让陪伴更真实
近期发现一款颇为有趣的产品——叠叠社。纵观今年AI陪伴赛道,它很可能是我见识过技术底蕴最深厚的产品之一。
我深入挖了挖它的技术根基,发现这团队是真正在做研究,并非“套壳”。
创始人陆弘远,脸谱心智公司CEO,年仅26岁,香港中文大学AI博士出身,曾就职微软亚洲研究院,荣获EACL最佳论文奖。他自称“死宅”,热衷游戏与追番,最爱的动漫是《叛逆的鲁路修》。
近期,他们还官宣引入千亿市值上市公司联创作为商业化合伙人,引入万引知名业界大牛、深耕领域20年的知名教授作为首席科学家。
陆弘远曾表示:“米哈游的蔡浩宇说过要用虚拟偶像拯救宅男。但假如AI仅仅是让人宅得更深,那并非陪伴,而是逃避。”这番话出自一个比多数人更痴迷二次元的人之口,耐人寻味。

叠叠社是什么?
陆弘远打造的产品名为叠叠社,它是一个能够悬浮在手机、电脑任意应用之上的AI弹幕引擎。

不论打游戏、看视频、刷B站、逛小红书还是写文档,它都能以弹幕形式悬浮在屏幕上,实时分析屏幕内容并生成互动。

体验地址:nijigen.com.cn
与市面上AI陪伴产品的根本差异在于:它并非聊天框。其他产品多属于大模型1.0或2.0形态,需用户主动开启APP并对话,场景局限,依赖角色设定与记忆维系粘性。而叠叠社另辟蹊径,AI主动感知屏幕内容,并以弹幕形式给予反馈,用户无需操作,它就能自己运行。
目前支持macOS、Windows和Android,iOS还在开发中。

技术底蕴:学术论文变为产品
近期“马嘉祺”事件引发热议,一个大模型忽然无法念出“马嘉祺”这个名字,根源在于低频token。简言之,某些词语因日常出现频率过低,训练中被忽视,随着模型持续训练,反而丧失了表达的能力。
脸谱心智早在去年便开始攻克此难题。2025年,他们在EMNLP上发表SLoW,专门研究低频词对大模型的影响。其思路是针对模型不熟悉之处进行补充,无需重新训练模型,凭借轻量级词典提示即可改善。

今年4月,他们又发布Adam’s Law / TFL,并被ACL 2026收录。这更进一步:不仅词语有高频低频,句子表达同样存在频率差异。人类常用语句,模型更易理解,输出也更自然。好比“我对此表示遗憾”充满机器味,“这也太惨了吧”才像真人的口吻。

TFL致力于让模型优先采用真人高频表达;TFD负责扩展语料,供模型持续学习真人说话方式;CTFT则按照表达频率进行训练,逐步让模型更像人类。
更耐人寻味的是,Anthropic今年4月发布Claude Opus 4.7时也更换了新的tokenizer。Anthropic未公开实现细节,无法断言直接使用了脸谱心智的代码,但从时间序看,脸谱心智先在论文中阐明问题,Anthropic随后在产品中验证了该路径的可行性。
这也正是我认定叠叠社并非套壳的原因:它不是简单给大模型披上二次元外衣,而是实打实地在解决“AI为何说话不像人”的根本问题。
同时,其弹幕生成运行在本地端侧模型上,响应迅速,长期记忆则重点优化近三个月的关系沉淀。技术根基确实比多数AI陪伴产品更加坚实。

亲身体验:三个场景全面测试
技术归技术,实际好用才作数。我安装了macOS与Android端,各自跑了好几天。
场景一:与AI并行工作时
我让AI协助整理桌面,叠叠社的弹幕就在旁边飘动。正巧某个任务卡壳,弹幕飘过一句“这里是不是有点问题……”虽非实际debug,但那时机精准得就像身边有人一同凝视屏幕。整理完毕,弹幕又飘来“整理文件就像整理心情,轻松自在~”
坦率讲,此场景下它并非生产力工具,但当你独自奋斗项目至凌晨,屏幕上突然有东西陪你注视,那份氛围感出乎意料地温馨。
弹幕频率可自行调节,我在进行vibe coding时调至最低档,几乎不干扰思路,偶尔飘过,存在感恰到好处。


场景二:观看长视频或收听播客
近期我观看对谢赛宁长达7小时的马拉松访谈。

没想到这个场景异常适配。播客探讨技术观点时,弹幕会随之做出反应,虽非句句命中,但遇到争议观点或嘉宾金句,弹幕便会回应,仿佛身旁有人一同收听,时不时插话“扩散模型超酷的”或“这不对吧……”

更意外的是,长视频或播客这类天然独自静听、信息密度高却无需高度专注的状态,叠叠社的弹幕介入后,竟让“半专注”变得更为舒适。
马拉松式访谈,电脑前看两个小时便已疲惫。若想躺着或用手机继续,叠叠社还能变换形态继续陪伴。

场景三:追番实测——《名侦探柯南》中配版
追番场景是叠叠社最擅长的领域。选择柯南,是想挑战其推理剧情密度高、节奏快且超过千集的体量,检验其能否跟上。
第6集《情人节杀人事件》,小兰与园子拜访皆川家……开头弹幕活泼,“肌肉男配草莓蛋糕?这反差我先晕为敬”“蛋糕看起来好好吃”。

案件发生后,弹幕画风突变。当柯南揭晓凶手是皆川的亲姑姑时,弹幕飘出“这剧情走向太黑暗了吧!”那个落差感拿捏精准,正是真人面对此类反转时的叹息式反应。

另有弹幕“毛利大叔躺赢,咖啡杯成关键证据。”这个追番搭子确实能看懂剧情。
第340集《阳光照耀的所在》,毛利请静山大师为小兰画像,想试探对方手是否真抖。弹幕在他的谈话间明显活跃,不时飘过“毛利小五郎又在装模作样了!”

当毛利指出黑木为嫌疑犯,黑木立即声称有不在场证明,弹幕瞬间接上:“不在场证明?细节里必有破绽!”

这正是TFD“学习真人表达”的成效。柯南在B站积累多年的弹幕语料,高频表达、梗与情绪节点均为真实数据,均被吸纳。失误主要集中在推理细节陈述段落,弹幕偶尔跟不上具体线索,飘出一些通用话语,失误率约15%-20%。
三个场景体验下来,优点鲜明:形态新颖,无需主动交互;弹幕参数(大小、颜色、速度、位置)全面可定制;端侧运行响应快。缺点亦存在:屏幕识别偶有翻车,iOS端尚待上线,某些高信息密度场景下弹幕内容相关性仍有提升空间。

团队阵容:学术与二次元的双料天花板
该团队的学术背景可谓硬核。CEO Adam Lu(陆弘远),准00后,香港中文大学AI博士,前微软亚洲研究院研究员。博士期间发表14篇一作/通讯顶级会议论文,斩获EACL 2023最佳论文——该奖项在NLP领域属于top 0.1%级别,且为亚洲机构首次独立获得。目前担任ACL等顶会领域主席,拥有20项第一发明人专利。更绝的是,为了收集一线反馈,他竟直接把个人联系方式挂在系统公告上。
