Claude Fable 5评测:断代领先的编程模型,价格却低于预期
今天必须以“震撼”开场,因为这是一款断代领先同行的模型,而且价格远没有想象中昂贵! 程序员和知识工作者的工作模式即将迎来巨变。
这次发布的模型没有被称作“神话 Mythos”,而是取名为“寓言 Fable”!
未来世界的神话,始于今日的寓言。
这件事注定会刷屏,我们先来看看官方公布的第一手消息。Claude系列正式迈入5.0时代。

Claude 是 Anthropic 旗下的大模型系列产品。
Claude 官方推文只有两句话:
推出 Claude Fable 5:一款神话级模型,我们已为其添加安全护栏,面向一般用户开放。
它的能力超越了我们此前任何公开可用的模型。
第一句点明新模型名为 Claude Fable 5,达到了 Mythos 级别的实力,并且套上了保护框架。
第二句指出能力超越了 Claude 以往所有模型,实际上可以去掉限定词——它超越了全球所有模型!
为什么敢这样说?请看第二条推文:
Fable 5 在几乎所有测试基准上均处于最先进水平,在软件工程、知识工作、科学研究和视觉领域都表现突出。任务越发长且复杂,Fable 5 相较于我们其他模型的优势就越大。
同时附上了这张基准对比图:

看到这张图确实令人头皮发麻。奥特曼看了恐怕都会瘫坐沙发,就像目睹原子弹爆炸一样。
这一次绝对不是夸张!
先看“智能体编程”类别中的 SWE-Bench Pro 基准。
“寓言” Fable 5 得分 80.3%,而预览版“神话” Mythos 5 为 77.8%。
也就是说,今天发布的寓言,比之前亮相的神话还要强悍。
在同一指标上:
Claude Opus 4.8 仅 69.2%
GPT‑5.5 仅 58.6%
Gemini 3.1 Pro 仅 54.2%!
要知道编程本身难度极大,Pro 基准又是高难度专业基准。在这样的专业测试中,居然能实现对前代与同行的断代式超越。
这是何等恐怖的实力!
智能体编程的第二项 FrontierCode,同样翻倍领先前代和 GPT‑5.5!
FrontierCode 是 Cognition 新推出的代码智能体基准,它不单单测试“代码能否跑通”,而是评估:AI 写出的代码,真实开源项目维护者是否愿意合并。它比 SWE‑bench 更贴近“真实 PR 质量”。
智能体编程的第三项基准 Terminal‑Bench 2.1,现在也位列第一,反超了此前的 GPT‑5.5。
当然,不止编程——知识工作、电脑使用、跨学科推理等领域也全部位居第一!
如果你看不懂那些数据和专业名词,只需记住一句话:在编程领域,Claude 已无敌手;在其他领域同样遥遥领先。
这一点,与日常使用感受完全一致。不要相信坊间那些鬼怪传说,说什么 GPT‑5.5 比 Opus 4.8 好用。
因为太强了,所以必须加上护栏! 这并非宣传话术,而是真的存在风险。
接下来看第三条推文:

Claude 表示:
发布如此强大的模型会带来风险。
若无防护措施,Fable 5 在网络安全等领域的能力可能被滥用,造成严重损害。
涉及狭隘主题范围的查询将转由我们次强的模型 Opus 4.8 响应。
我的理解是,网络安全等特殊领域会自动交由 Opus 4.8 处理!
也就是说,当 Fable 察觉你要搞破坏,它会把任务指派给小弟 Opus 4.8,劝你做个好人。
除此之外,还可能给你黄牌警告:
寓言 5 的防护措施能够检测与网络安全、生物学和化学以及蒸馏相关的内容。每当触发备用机制时,用户都会收到通知——平均发生在不到 5% 的会话中。
另外,那个无比强大的 Mythos 5 正式版,只会小范围提供给网络防御者和关键基础服务提供商。
这里可以明确一点:Mythos 5 与 Fable 5 共享相同的底层模型,但某些领域的防护被解除了。
最后一条消息是:
Claude Fable 5 今天已在全球范围内可用。
Claude Mythos 5 目前仅限 Glasswing 合作伙伴使用,直至我们扩展可信访问计划。
也就是说,所有 Claude Pro+ 用户都可以立即使用 Fable 5 模型。
实测也确实能用了:

打开 Claude.ai 会弹出窗口。
弹窗给出两个信息,一是我的套餐可用,但要消耗 2 倍配额。
二是强调,若某些消息触发风控,会转由其他模型处理。
这里最关键的信息是“价格”:

提示显示:配额消耗是 Opus 的两倍!
也就是说,价格大约是 Opus 的两倍。单看这个已经算贵了,但比我预想的便宜很多。
坊间盛传输出价格要 150 美元,实际上只要 50 美元!
这一点可从 Claude 官方邮件中确认:

输入价格 10 美元/百万 Token,输出价格 50 美元/百万 Token。
基于如此强悍的基准数据,这个价格真的一点都不贵!
这个价格与 Claude Opus 4.8 Fast 持平。
比 GPT‑5.5 Pro 便宜很多。GPT‑5.5 Pro 的输入价是 ,输出价 180 美元!
这么一看,我觉得自己的 Pro 账号也能多聊几句了,哈哈!
关于 Fable 的最新消息基本都在这里了。
从基准和价格来看,我只能说“物美价廉”!对于追求极致性能的人来说,这个模型绝对物超所值。
而且我觉得,程序员这一职业将被彻底重构,不再是执行者,而是控制者!
其他职业也将发生翻天覆地的变化。
Anthropic 没有给我一分钱,但我依然要这么说!
因为确实太强了!他们家的基准相对靠谱。
接下来,我会进行实际测试。你们觉得要不要找几款国产模型作参考,还是单独测就好!