美企AI成本激增恐慌蔓延，中国模型凭“够用便宜”改写全球算力博弈

June 27, 2026

企业正在用路由把AI账单拆成两部分：容易的任务丢给便宜模型，难的才交给旗舰。与此同时，视频生成这个更考验算力和产品闭环的赛道，国产模型已经进入官方生产更新节奏。

图注：这张配图来自Rohan Paul在X平台转发的UBS调查截图，企业被高额账单驱动，开始用更便宜模型和开源中国模型替换原来自主采购的旗舰模型。

账单直接怼到企业脸上了

海外科技公司终于尝到“什么都用旗舰模型”的惨烈代价：有企业单个用户月支出高达3.5万美元，团队配额超限两倍，内部AI工具从5个砍到只剩2个。UBS调查显示，在紧盯AI预算的企业里，六成已经转向更便宜的模型。

这并非“不用AI”，而是换一种更精明的用法。多数公司开始做模型路由：轻任务丢给开源或低价模型，重推理、代码和长上下文才保留给旗舰。这等于把模型预算拆成两层，和云厂商用廉价T4配大A100的思路如出一辙。

OpenRouter的数据将这种趋势加倍放大：2026年5月全球总调用量28.9万亿Token，连续五周攀升。中国模型周调用量9.2万亿，环比近20%，美国模型4.9万亿。

图注：字节跳动Seed产品矩阵正在把2.0/视频/图像/语音统一成可生产交付的模型层，图里Dola、Dreamina、Coze这些产品就是真实接入链。

视频生成早已不是“效果图”

比文本更耗算力、更难标准化的视频赛道，中国模型的节奏明显更快。字节跳动的Seedance 2.0早在2026年2月已经官方发布，产品定位为统一多模态音视频生成、运动复杂度SOTA。同年6月，Seed2.1进一步升级智能体和编码能力，Doubao App和Dreamina等产品已经在用这套模型层支撑真实用户需求。

真正让美国创始人们辗转难眠的绝不仅仅是成本。开源模型在多个评测侧面已经接近甚至打平闭源旗舰，再加上当地使用成本极低、本地部署可行，让海外企业越来越难以用“技术代差”来说服CFO继续买单。

竞争从来不是单一基准的较量，而是看模型能否匹配整个行业的成本曲线。

GLM 5.2的例子同样印证了这一点。专业评测和社区反馈都指向同一种趋势：在代码和工程任务中，开源模型已经可以和上一代旗舰平起平坐。中国模型不需要在每项指标上领先，只要把成本曲线压到企业可负担的位置，就已经改变了市场价格锚点。

靠高科技溢价维持高毛利的美式商业叙事正被更务实的选择打断。这一次，美国厂商最深的焦虑不是某个中国模型超越GPT，而是他们的模型越来越像奢侈品，而全球市场正在从“不惜一切用最好的”转向“够用和便宜优先”。