日本Fugu Ultra模型深度剖析：号称对标Fable5，实为多模型智能调度中枢

June 25, 2026

今天一打开手机，就看到了一条相当“新鲜”的资讯！

据说日本推出了一款名为 Fugu Ultra 的模型，性能可以直接比肩 Fable 5 和 Mythos！

接着有人贴出了下面这张图：

单看图表，的确有一种很强的压迫感！

部分基准测试的数据甚至压过了 Mythos 和 Fable 5！

编程能力优于 Opus 4.8，略逊于 Fable 5。

数据确实亮眼。以前几乎没听说过日本冒头的模型，这次突然刷屏，好奇心立刻被拉满了。

于是我仔细挖了一下背后的信息：

Sakana AI 于 2026 年 6 月 22 日正式发布了这款新品。它真正的差异化核心在于：并不是又一个更庞大的基础模型，而是“一个被训练来调度其他模型的模型”——像指挥家一样运作的语言模型。

对外，它表现得与普通模型毫无二致：你只需调用一个 API 端点；对内，它却是一整条多智能体编排系统。Fugu 会自行判断——简单问题直接回答，复杂的多步任务则临时组建并协调一支“专家模型小分队”，模型选择、任务分配、结果验证、答案合成全部在内部消化，调用方的代码完全感知不到多智能体的复杂度。它甚至还能递归调用自己。

这……这不就是一个“智能中转站”吗？就跟 OpenAI 不同模型之间的“内部路由”差不多！拿这个去和 Mythos、Fable 5 直接对标，多少有点黑色幽默。

如果说从对标 Mythos 的角度切入确实有点滑稽，但如果从它自身的卖点出发，倒是真有点儿意思。

核心卖点解析

1. 单一 API，隐藏所有复杂度
一个兼容 OpenAI 的端点，把“多智能体系统”的麻烦事统统封装掉。你不需要自己搭编排框架，也不用操心路由和调度。

2. 前沿性能，但不绑定单一厂商
官方宣称 Fugu Ultra 在工程、科学、推理等高难度基准上能与 Anthropic 的 Fable 5、Mythos Preview 等顶级模型“平起平坐”，并声称在多项应用上超越 Gemini 3.1 Pro、Opus 4.8 和 GPT-5.5。（值得留意：这些是 Sakana 自己报告的数据，第三方对比基准以外的部分还有待独立验证。）

3. “绕开供应链风险”
这可是他们这次主推的最大叙事！底层的模型池是可以随时替换的。
如果某家供应商断供（他们直接点名了近期 Anthropic 的 Fable / Mythos 因出口管制而访问受限），Fugu 会动态绕行。他们甚至把这个提升到“AI 主权”的高度，主攻那些把 AI 部署在关键基础设施、金融、政务领域，不愿被单一厂商卡脖子的组织与国家。

4. 两个档位，按需选择

Fugu：性能与低延迟平衡，日常默认款，适合编程、代码审查、聊天机器人等交互场景；支持把特定 agent 移出池子以满足数据/隐私/合规要求。
Fugu Ultra：冲击最高答案质量的硬核多步骤任务，调动更深层的专家池。

5. 强在“长链条、脏活、累活”
官方反复强调，它的价值不在于单条 prompt 答得有多好，而在于长跑——阅读、实现、测试、比对、找漏洞、出报告，能在很多步骤里持续推进。近 500 人的 beta 反馈集中在代码审查（“别人指出 3 个 bug，它揪出 20 多个”）、几乎全自动的数据科学研究、端到端安全评估，以及长会话中人格/角色稳定不漂移。

6. 会自我进化
因为靠的是“学习来的编排”而非写死的工作流，当生态里出现更新更强的模型时，直接纳入 agent 池，收益便会顺带传递给用户。

所以，从纯模型技术的角度看，这东西并没有太多新东西，但从实用性的角度出发，好像确实能打。

官网的 GitHub 上放了几个样例：

在这几类场景中，表现似乎相当不错！

其实，对它的能力上限我们心里已经很有数了——底层接入的最强模型，就是它的天花板。剩下的就得看看价格香不香了。

定价与收费模式

收费方面，它们提供了两种方式：订阅制和按量付费。

订阅制分三档：Standard、100（10 倍额度）以及 Max 200 美元（20 倍额度）/ 月，全都包含两个型号。

好家伙，这个定价策略跟 Claude 简直是一个模子刻出来的！

按量付费方面，Fugu Ultra（fugu-ultra-20260615）每百万 token 的价格为：输入 15 美元 / 输出 30 美元 / 缓存输入 0.50 美元，上下文超过 272K 则翻倍。

2026 年 7 月底前订阅，送第二个月免费。

这个 API 定价与 Opus 4.8 比较接近，但比 Fable 5 确实便宜不少。

如果它真能给我把 Fable 5 配进去，我觉得这个套餐和 API 价格确实挺实惠的。

我为此特意跑了一趟它们官网：

网页设计倒是挺干净利落的！

官网也提供了 Chat 功能，我用谷歌账号登录，随便聊了一句：

也可以直接通过 API 接入：

在 API 创建窗口里，居然可以直接选择调用哪些模型！这个设计……这不就是典型的中转站嘛！当然，它额外加了一个专门训练的模型来做智能调度，如果调度得当，确实既能省成本，又可以用上高性能模型。

目前它们主推 Codex 接入，走 OpenAI 的协议：

export SAKANA_API_KEY={your api key}  

curl -X POST https://api.sakana.ai/v1/chat/completions \  
  -H "Content-Type: application/json" \  
  -H "Authorization: Bearer $SAKANA_API_KEY" \  
  -d '{"model":"fugu","messages":[{"role":"user","content":"How many r in word strawberry"}]}'

我试了一下，在国内打开速度飞快，账单地址还支持选中国！我好像真的有点心动了。

要不干脆订一个月，实测一波？

不过，最大的疑问还是他们订阅套餐的额度到底怎么样，以及能否接入 Fable 这类顶级模型（我估计够呛）。

这种调度系统最深的坑就是，你压根不知道实际调用的是哪个模型。搞不好就是付了 Mythos 的钱，背后给你扔来一个 Haiku！打个形象点的比喻：你点的是西施，它却给你换上如花，灯下黑，你根本分辨不清。