智谱GLM-5.2发布:1M超长上下文+MIT开源,AI编程模型迈入全仓库时代

短短四个月,智谱接连推出GLM-5、GLM-5.1与GLM-5.2,完成了三代旗舰模型的快速迭代。最新版本聚焦两个核心数字:1M上下文窗口与MIT开源许可。它们共同传递一个信号:开发者可以自由使用、修改和部署,没有任何上限。
一则社交动态,引爆关注
6月13日,Z.ai官方账号发布了一条极其简短的动态。没有预热情感渲染,没有直播发布会,仅仅几段文字和一个链接,却概括了所有重磅信息:GLM-5.2向GLM Coding Plan全体用户开放,支持1M上下文,编码能力显著增强,API和聊天机器人下周上线,模型以MIT协议开源。动态结尾的那句话尤其值得回味——「AI的未来是开放的,它属于人民。」
GLM Coding Plan是智谱专为AI编程场景设计的订阅服务,覆盖Lite、Pro、Max、Team四个级别,兼容Claude Code、OpenClaw、Cursor等主流开发工具。此次升级让订阅用户无需额外配置,即可无缝切换至5.2。这条动态迅速引发热议,收获了124条回复、2467个点赞和17万次浏览。
从20万到100万Token:上下文窗口的质变
梳理智谱2026年的模型迭代时间线:2月推出GLM-5,采用745B参数MoE架构,上下文长度200K,SWE-bench Verified得分为77.8%,并以MIT协议开源。4月GLM-5.1发布,长程任务处理能力大幅强化,在SWE-Bench Pro基准上夺得当时开源模型的SOTA。到了6月的GLM-5.2,上下文窗口从200K直接跃升至1M,完成了一次数量级的跨越。
200K到1M并非简单的数值倍增。长上下文处理是当前大模型竞争的硬骨头,注意力机制需要在五倍长度的序列上维持精准度,同时不拖垮推理效率,控制显存消耗。早在GLM-5时代,智谱就已采用DeepSeek Sparse Attention实现稀疏注意力优化,5.2版本能将上下文拓展至1M,表明其在长序列训练与推理优化上获得了实质性突破。
对于开发者而言,这等于可以把整个代码仓库“喂”进上下文窗口。一个拥有数十万行代码的中型项目,连同相关的Issues、技术文档和设计稿,都能在一次请求中处理完毕。无论是复杂的系统重构、跨模块联合调试,还是大规模代码审查,1M上下文窗口构成了这些高阶编程场景的“分水岭”。
MIT许可证:无门槛的开放生态
MIT是目前最宽松的开源许可证之一,它允许商用、二次修改与再分发,唯一的硬性要求是在分发时保留原始版权声明。对于一家商业公司而言,这几乎等同于毫无保留的开放。智谱从GLM-5开始就坚定地选择了MIT许可,GLM-5.1与GLM-5.2延续这一策略,每一版模型权重均可在HuggingFace和ModelScope上自由下载。
明确的受益方随之浮现。中小型企业或团队可以下载模型进行私有化部署,摆脱对外部API的依赖,消除数据外泄的担忧。对于金融、医疗等合规监管严格的行业,开源模型成了进入AI编程领域的“通行证”。在受NVIDIA出口限制影响的地区,GLM-5系列还支持在华为昇腾NPU上运行,这一硬件适配进一步拓宽了前沿模型的可及范围,让更多开发者受益。
GLM Coding Plan的订阅定价本已具备很强的竞争力。输入成本为每百万tokens 1美元,输出为3.2美元,大幅低于GPT与Claude的价格。配合MIT开源,企业相当于手握双选项:既可依据需求调用API,也能直接下载模型自托管,决策权完全交还到开发者手中。
三代更迭,一脉相承的开放路线
将GLM-5、5.1、5.2三者并置而观,智谱的迭代路线显得十分透彻。每一代都沿着两条主线演进:拓展上下文边界,深化编码能力。从200K到1M,是量变酿成质变的过程;从SWE-bench评测到长程Agent任务,再到全仓库级上下文,每一代产品覆盖的工程场景都在持续扩大。
开源绝非跟风的市场营销。三代旗舰模型全部采用MIT协议,每一版都可以下载、商用和私有化部署。面对这样的持续输出,那些仅开源过时版本或只放出蒸馏小模型的公司相形见绌,格局高下立判。
工具链的广泛兼容筑起了另一道实用壁垒。GLM Coding Plan全面适配Claude Code、OpenClaw、Cursor等主流开发环境,用户无需学习新IDE或命令行工具。将迁移摩擦压低,有时比单纯的性能指标更容易撬动大规模采用。
GLM-5.2的API服务和开源模型权重将在下周正式开放。对于正处于编程模型选型阶段的团队而言,这两个节点值得并行追踪。