Claude Fable模型上手详测：新SOTA背后的喜与忧

June 15, 2026

今天早上，Anthropic 正式发布了新模型 Claude Fable——也就是前阵子沸沸扬扬的 Mythos「神话」民用简化版。毕竟号称是“AGI 水准的模型”，我自然第一时间上手实测，看它到底有几分真功夫。

先说结论：确实很强，当之无愧的新 SOTA。但代价不菲，姿态也不太好看。

两个月前 Mythos Preview 才刚放出风声，我就写过一篇《AGI已经来了，但你有船票吗？》，讨论的是顶级 AI 能力正在被圈禁起来这件事。如今看来一语成谶——这次连命名都不再遮掩：Mythos（神话）是供奉给通过审查的“领主”的，Fable（寓言）则是讲给平民听的。 同一个底层模型，Fable 是被施了阉割与加锁的版本。

Benchmark table titled Mythos 5 & Fable 5, comparing Claude Mythos 5 and Fable 5 against Claude Mythos Preview, Claude Opus 4.8, GPT 5.5, and Gemini 3.1 Pro.

在这次发布之前，我已经将 Claude 降级到每月 100 美元的套餐，平时基本在吃灰——主力是 Codex，Claude 只负责打杂和 review。而用完 Fable 后，我的判断是：Claude 又重新抬起了头，可以再战。当即决定升回每月 200 美元的 Max 套餐。跑过几个真实场景后，感受尤其鲜明：Fable 确实具备洞察力，是新 SOTA 的实至名归者。

这正应了我之前《退订 Claude，拥抱 Codex》里的说法：AI 行业风水轮流转，城头变幻大王旗，SOTA 几个月就能换一轮。

实战检验：能否发现 Codex 看不见的问题？

我的测试方法很简单直接：不跑 Benchmark，不看竞技场天梯，就把手头真实的工作场景丢给它 review，看它能不能揪出真正有价值的隐患，给出切实的改进方案。

我日常的 vibe coding 工作流是双模型对抗：Codex 5.5 担任主力，Claude 4.8 充当后备 reviewer——任何补丁必须让两边都承认“没有进一步改进空间”，我才会验收提交。因此我的判断标准也很直截：在双模型已经收敛的状态上，新模型还能挖出新的问题，那它的能力就是实打实的更强。对我来说，这比任何跑分都有说服力。

案例一：MinIO CVE 补丁复审。 我让 Fable 重新审阅之前给 MinIO 社区分支打的几个 CVE 安全补丁，看是否仍存在改进余地。结果它真挖出了几个新问题——拿去问 Codex，Codex 也承认：这些点确实值得修复补充。

案例二：pg_exporter 的 PG 19 适配。 之前我让 Codex 做了 PostgreSQL 19 Beta 1 的兼容工作，把新版本的可观测性指标加了进去。这次让 Fable 独立重做一遍，产出质量明显好于 Codex 此前所能达到的收敛状态。

案例三：Pigsty PITR 脚本改进。 我在数据库中提供了一个应急的时间点恢复脚本，这次也请 Claude Fable 重新 review。它几乎把所有未覆盖的细节都填补完整了。在 Codex 已经挑不出毛病的状态下，Fable 反而能洞察到新的改进空间。

槽点剖析：能力给足，体验却处处掣肘

当然，对于这次 Fable 发布，我的意见也相当不少。

槽点一：动态降级机制。 Fable 加入了反蒸馏与投毒保护，外加一套令人极其烦躁的动态降级策略：系统一旦检测到你正在从事 AI Agent 相关工作，就会主动降低智商——用着用着，突然就退回 Opus 4.8，甚至只是聊些日常问题都可能触发。这种使用体验，实在让人如鲠在喉。

举个例子，每当我和 Claude 讨论 Agent / AI 相关的主题时，它每次都从 Fable 原地跳回 Opus 4.8。Anthropic 的官方口径是“超过 95% 的对话不会触发降级”。翻译一下：约 5% 的对话会中招。这个比例，相当离谱。

槽点二：12 天限时体验。 Fable 目前不在 Claude Code 的订阅计划中。从今天到 22 号这 12 天里，100/200 美元档的订阅用户可以限时尝鲜；22 号之后，就只剩下 API 按量付费这一条路。官方解释是产能不足、算力不够，以后算力上来了或许能进入订阅标配——但没有明确的时间表。

槽点三：强制数据留档。 只要使用 Fable，不论是否企业用户，所有流量一律强制保留 30 天，并会被审查，这与之前的政策明显不同。说穿了，还是那个熟悉的配方——“数据换算力”。对于在乎数据隐私与合规的企业用户而言，这绝不是可以忽略的变化。

所以，算一笔经济账

API 是什么价位？我曾在《AI时代的最大红利》里算过这笔账：两百美元的订阅如果能用满，大约能薅走 API 标价一万美元左右的 Token。也就是说按量付费的成本是订阅用满价格的 50 倍。反过来说，走 API 计费，你要多付出几十倍的成本才能获得同样的用量。

因此对日常使用而言，长期用 API 跑 Fable 纯属冤大头。也正因如此，这 12 天的订阅窗口期才显得格外珍贵——这是普通用户以订阅价格触达顶级智力的唯一通道。

所以我这几天的计划，就是让那些在之前模型下已经收敛的问题和特性，通通被 Fable 重新审视、修改一遍。目前的计划分三步：

走一步看一步，先把能薅的羊毛薅到手；
将过去一些有价值的讨论，用 Fable 再次深挖；
把过往的 patch 和 feature，悉数让它再 review 一轮。

这也是我建议你现在立刻动起来的事：评估好这 12 天的窗口期，不用就过期作废。无论如何，你都该亲手摸一摸当前 SOTA 模型，或者说“AGI 模型”实际的能力边界——这种真实触感，看一百篇评测文章也替代不了。

更多有趣的案例与动态

结语：智力溢价只在边界兑现

总体而言，我的判断是：对于日常使用——哪怕是专业的日常使用——Fable 的能力其实是过剩的，GPT 5.5 / Opus / Sonnet 级别的模型早已绰绰有余。

但在前沿场景：安全漏洞挖掘、疑难杂症的诊断定位、开放式的研究探索——这类“智力越高越好、上不封顶”的场景，Fable 才能兑现它真正的巨大价值。

智力溢价，只在智力边界上兑现。 这大概就是 Mythos 时代的游戏规则：神话握在领主和大祭司手里，寓言则是讲给平民听的。而你现在能做的，就是趁城门还没关上——进去亲眼看看。