Claude Fable模型上手详测:新SOTA背后的喜与忧
今天早上,Anthropic 正式发布了新模型 Claude Fable——也就是前阵子沸沸扬扬的 Mythos「神话」民用简化版。毕竟号称是“AGI 水准的模型”,我自然第一时间上手实测,看它到底有几分真功夫。
先说结论:确实很强,当之无愧的新 SOTA。但代价不菲,姿态也不太好看。

两个月前 Mythos Preview 才刚放出风声,我就写过一篇《AGI已经来了,但你有船票吗?》,讨论的是顶级 AI 能力正在被圈禁起来这件事。如今看来一语成谶——这次连命名都不再遮掩:Mythos(神话)是供奉给通过审查的“领主”的,Fable(寓言)则是讲给平民听的。 同一个底层模型,Fable 是被施了阉割与加锁的版本。

在这次发布之前,我已经将 Claude 降级到每月 100 美元的套餐,平时基本在吃灰——主力是 Codex,Claude 只负责打杂和 review。而用完 Fable 后,我的判断是:Claude 又重新抬起了头,可以再战。当即决定升回每月 200 美元的 Max 套餐。跑过几个真实场景后,感受尤其鲜明:Fable 确实具备洞察力,是新 SOTA 的实至名归者。
这正应了我之前《退订 Claude,拥抱 Codex》里的说法:AI 行业风水轮流转,城头变幻大王旗,SOTA 几个月就能换一轮。
实战检验:能否发现 Codex 看不见的问题?
我的测试方法很简单直接:不跑 Benchmark,不看竞技场天梯,就把手头真实的工作场景丢给它 review,看它能不能揪出真正有价值的隐患,给出切实的改进方案。
我日常的 vibe coding 工作流是双模型对抗:Codex 5.5 担任主力,Claude 4.8 充当后备 reviewer——任何补丁必须让两边都承认“没有进一步改进空间”,我才会验收提交。因此我的判断标准也很直截:在双模型已经收敛的状态上,新模型还能挖出新的问题,那它的能力就是实打实的更强。对我来说,这比任何跑分都有说服力。
案例一:MinIO CVE 补丁复审。 我让 Fable 重新审阅之前给 MinIO 社区分支打的几个 CVE 安全补丁,看是否仍存在改进余地。结果它真挖出了几个新问题——拿去问 Codex,Codex 也承认:这些点确实值得修复补充。

案例二:pg_exporter 的 PG 19 适配。 之前我让 Codex 做了 PostgreSQL 19 Beta 1 的兼容工作,把新版本的可观测性指标加了进去。这次让 Fable 独立重做一遍,产出质量明显好于 Codex 此前所能达到的收敛状态。

案例三:Pigsty PITR 脚本改进。 我在数据库中提供了一个应急的时间点恢复脚本,这次也请 Claude Fable 重新 review。它几乎把所有未覆盖的细节都填补完整了。在 Codex 已经挑不出毛病的状态下,Fable 反而能洞察到新的改进空间。

槽点剖析:能力给足,体验却处处掣肘
当然,对于这次 Fable 发布,我的意见也相当不少。
槽点一:动态降级机制。 Fable 加入了反蒸馏与投毒保护,外加一套令人极其烦躁的动态降级策略:系统一旦检测到你正在从事 AI Agent 相关工作,就会主动降低智商——用着用着,突然就退回 Opus 4.8,甚至只是聊些日常问题都可能触发。这种使用体验,实在让人如鲠在喉。
举个例子,每当我和 Claude 讨论 Agent / AI 相关的主题时,它每次都从 Fable 原地跳回 Opus 4.8。Anthropic 的官方口径是“超过 95% 的对话不会触发降级”。翻译一下:约 5% 的对话会中招。这个比例,相当离谱。



槽点二:12 天限时体验。 Fable 目前不在 Claude Code 的订阅计划中。从今天到 22 号这 12 天里,100/200 美元档的订阅用户可以限时尝鲜;22 号之后,就只剩下 API 按量付费这一条路。官方解释是产能不足、算力不够,以后算力上来了或许能进入订阅标配——但没有明确的时间表。

槽点三:强制数据留档。 只要使用 Fable,不论是否企业用户,所有流量一律强制保留 30 天,并会被审查,这与之前的政策明显不同。说穿了,还是那个熟悉的配方——“数据换算力”。对于在乎数据隐私与合规的企业用户而言,这绝不是可以忽略的变化。
所以,算一笔经济账
API 是什么价位?我曾在《AI时代的最大红利》里算过这笔账:两百美元的订阅如果能用满,大约能薅走 API 标价一万美元左右的 Token。也就是说按量付费的成本是订阅用满价格的 50 倍。反过来说,走 API 计费,你要多付出几十倍的成本才能获得同样的用量。

因此对日常使用而言,长期用 API 跑 Fable 纯属冤大头。也正因如此,这 12 天的订阅窗口期才显得格外珍贵——这是普通用户以订阅价格触达顶级智力的唯一通道。
所以我这几天的计划,就是让那些在之前模型下已经收敛的问题和特性,通通被 Fable 重新审视、修改一遍。目前的计划分三步:
- 走一步看一步,先把能薅的羊毛薅到手;
- 将过去一些有价值的讨论,用 Fable 再次深挖;
- 把过往的 patch 和 feature,悉数让它再 review 一轮。
这也是我建议你现在立刻动起来的事:评估好这 12 天的窗口期,不用就过期作废。无论如何,你都该亲手摸一摸当前 SOTA 模型,或者说“AGI 模型”实际的能力边界——这种真实触感,看一百篇评测文章也替代不了。
更多有趣的案例与动态




结语:智力溢价只在边界兑现
总体而言,我的判断是:对于日常使用——哪怕是专业的日常使用——Fable 的能力其实是过剩的,GPT 5.5 / Opus / Sonnet 级别的模型早已绰绰有余。
但在前沿场景:安全漏洞挖掘、疑难杂症的诊断定位、开放式的研究探索——这类“智力越高越好、上不封顶”的场景,Fable 才能兑现它真正的巨大价值。
智力溢价,只在智力边界上兑现。 这大概就是 Mythos 时代的游戏规则:神话握在领主和大祭司手里,寓言则是讲给平民听的。而你现在能做的,就是趁城门还没关上——进去亲眼看看。