美企AI成本激增恐慌蔓延,中国模型凭“够用便宜”改写全球算力博弈
企业正在用路由把AI账单拆成两部分:容易的任务丢给便宜模型,难的才交给旗舰。与此同时,视频生成这个更考验算力和产品闭环的赛道,国产模型已经进入官方生产更新节奏。


图注:这张配图来自Rohan Paul在X平台转发的UBS调查截图,企业被高额账单驱动,开始用更便宜模型和开源中国模型替换原来自主采购的旗舰模型。
账单直接怼到企业脸上了
海外科技公司终于尝到“什么都用旗舰模型”的惨烈代价:有企业单个用户月支出高达3.5万美元,团队配额超限两倍,内部AI工具从5个砍到只剩2个。UBS调查显示,在紧盯AI预算的企业里,六成已经转向更便宜的模型。
这并非“不用AI”,而是换一种更精明的用法。多数公司开始做模型路由:轻任务丢给开源或低价模型,重推理、代码和长上下文才保留给旗舰。这等于把模型预算拆成两层,和云厂商用廉价T4配大A100的思路如出一辙。
OpenRouter的数据将这种趋势加倍放大:2026年5月全球总调用量28.9万亿Token,连续五周攀升。中国模型周调用量9.2万亿,环比近20%,美国模型4.9万亿。

图注:字节跳动Seed产品矩阵正在把2.0/视频/图像/语音统一成可生产交付的模型层,图里Dola、Dreamina、Coze这些产品就是真实接入链。
视频生成早已不是“效果图”
比文本更耗算力、更难标准化的视频赛道,中国模型的节奏明显更快。字节跳动的Seedance 2.0早在2026年2月已经官方发布,产品定位为统一多模态音视频生成、运动复杂度SOTA。同年6月,Seed2.1进一步升级智能体和编码能力,Doubao App和Dreamina等产品已经在用这套模型层支撑真实用户需求。
真正让美国创始人们辗转难眠的绝不仅仅是成本。开源模型在多个评测侧面已经接近甚至打平闭源旗舰,再加上当地使用成本极低、本地部署可行,让海外企业越来越难以用“技术代差”来说服CFO继续买单。
竞争从来不是单一基准的较量,而是看模型能否匹配整个行业的成本曲线。
GLM 5.2的例子同样印证了这一点。专业评测和社区反馈都指向同一种趋势:在代码和工程任务中,开源模型已经可以和上一代旗舰平起平坐。中国模型不需要在每项指标上领先,只要把成本曲线压到企业可负担的位置,就已经改变了市场价格锚点。
靠高科技溢价维持高毛利的美式商业叙事正被更务实的选择打断。这一次,美国厂商最深的焦虑不是某个中国模型超越GPT,而是他们的模型越来越像奢侈品,而全球市场正在从“不惜一切用最好的”转向“够用和便宜优先”。