日本Fugu Ultra模型深度剖析:号称对标Fable5,实为多模型智能调度中枢
今天一打开手机,就看到了一条相当“新鲜”的资讯!

据说日本推出了一款名为 Fugu Ultra 的模型,性能可以直接比肩 Fable 5 和 Mythos!
接着有人贴出了下面这张图:

单看图表,的确有一种很强的压迫感!
部分基准测试的数据甚至压过了 Mythos 和 Fable 5!
编程能力优于 Opus 4.8,略逊于 Fable 5。
数据确实亮眼。以前几乎没听说过日本冒头的模型,这次突然刷屏,好奇心立刻被拉满了。
于是我仔细挖了一下背后的信息:
Sakana AI 于 2026 年 6 月 22 日正式发布了这款新品。它真正的差异化核心在于:并不是又一个更庞大的基础模型,而是“一个被训练来调度其他模型的模型”——像指挥家一样运作的语言模型。
对外,它表现得与普通模型毫无二致:你只需调用一个 API 端点;对内,它却是一整条多智能体编排系统。Fugu 会自行判断——简单问题直接回答,复杂的多步任务则临时组建并协调一支“专家模型小分队”,模型选择、任务分配、结果验证、答案合成全部在内部消化,调用方的代码完全感知不到多智能体的复杂度。它甚至还能递归调用自己。

这……这不就是一个“智能中转站”吗?就跟 OpenAI 不同模型之间的“内部路由”差不多!拿这个去和 Mythos、Fable 5 直接对标,多少有点黑色幽默。
如果说从对标 Mythos 的角度切入确实有点滑稽,但如果从它自身的卖点出发,倒是真有点儿意思。
核心卖点解析
1. 单一 API,隐藏所有复杂度
一个兼容 OpenAI 的端点,把“多智能体系统”的麻烦事统统封装掉。你不需要自己搭编排框架,也不用操心路由和调度。
2. 前沿性能,但不绑定单一厂商
官方宣称 Fugu Ultra 在工程、科学、推理等高难度基准上能与 Anthropic 的 Fable 5、Mythos Preview 等顶级模型“平起平坐”,并声称在多项应用上超越 Gemini 3.1 Pro、Opus 4.8 和 GPT-5.5。(值得留意:这些是 Sakana 自己报告的数据,第三方对比基准以外的部分还有待独立验证。)
3. “绕开供应链风险”
这可是他们这次主推的最大叙事!底层的模型池是可以随时替换的。
如果某家供应商断供(他们直接点名了近期 Anthropic 的 Fable / Mythos 因出口管制而访问受限),Fugu 会动态绕行。他们甚至把这个提升到“AI 主权”的高度,主攻那些把 AI 部署在关键基础设施、金融、政务领域,不愿被单一厂商卡脖子的组织与国家。
4. 两个档位,按需选择
- Fugu:性能与低延迟平衡,日常默认款,适合编程、代码审查、聊天机器人等交互场景;支持把特定 agent 移出池子以满足数据/隐私/合规要求。
- Fugu Ultra:冲击最高答案质量的硬核多步骤任务,调动更深层的专家池。
5. 强在“长链条、脏活、累活”
官方反复强调,它的价值不在于单条 prompt 答得有多好,而在于长跑——阅读、实现、测试、比对、找漏洞、出报告,能在很多步骤里持续推进。近 500 人的 beta 反馈集中在代码审查(“别人指出 3 个 bug,它揪出 20 多个”)、几乎全自动的数据科学研究、端到端安全评估,以及长会话中人格/角色稳定不漂移。
6. 会自我进化
因为靠的是“学习来的编排”而非写死的工作流,当生态里出现更新更强的模型时,直接纳入 agent 池,收益便会顺带传递给用户。
所以,从纯模型技术的角度看,这东西并没有太多新东西,但从实用性的角度出发,好像确实能打。
官网的 GitHub 上放了几个样例:

在这几类场景中,表现似乎相当不错!
其实,对它的能力上限我们心里已经很有数了——底层接入的最强模型,就是它的天花板。剩下的就得看看价格香不香了。
定价与收费模式
收费方面,它们提供了两种方式:订阅制和按量付费。

订阅制分三档:Standard、100(10 倍额度)以及 Max 200 美元(20 倍额度)/ 月,全都包含两个型号。
好家伙,这个定价策略跟 Claude 简直是一个模子刻出来的!

按量付费方面,Fugu Ultra(fugu-ultra-20260615)每百万 token 的价格为:输入 15 美元 / 输出 30 美元 / 缓存输入 0.50 美元,上下文超过 272K 则翻倍。
2026 年 7 月底前订阅,送第二个月免费。
这个 API 定价与 Opus 4.8 比较接近,但比 Fable 5 确实便宜不少。
如果它真能给我把 Fable 5 配进去,我觉得这个套餐和 API 价格确实挺实惠的。
我为此特意跑了一趟它们官网:

网页设计倒是挺干净利落的!
官网也提供了 Chat 功能,我用谷歌账号登录,随便聊了一句:

也可以直接通过 API 接入:

在 API 创建窗口里,居然可以直接选择调用哪些模型!这个设计……这不就是典型的中转站嘛!当然,它额外加了一个专门训练的模型来做智能调度,如果调度得当,确实既能省成本,又可以用上高性能模型。
目前它们主推 Codex 接入,走 OpenAI 的协议:
export SAKANA_API_KEY={your api key}
curl -X POST https://api.sakana.ai/v1/chat/completions \
-H "Content-Type: application/json" \
-H "Authorization: Bearer $SAKANA_API_KEY" \
-d '{"model":"fugu","messages":[{"role":"user","content":"How many r in word strawberry"}]}'
我试了一下,在国内打开速度飞快,账单地址还支持选中国!我好像真的有点心动了。

要不干脆订一个月,实测一波?
不过,最大的疑问还是他们订阅套餐的额度到底怎么样,以及能否接入 Fable 这类顶级模型(我估计够呛)。
这种调度系统最深的坑就是,你压根不知道实际调用的是哪个模型。搞不好就是付了 Mythos 的钱,背后给你扔来一个 Haiku!打个形象点的比喻:你点的是西施,它却给你换上如花,灯下黑,你根本分辨不清。