Sakana AI が Fugu 発表――マルチモデルオーケストレーションで Fable 5 と同等性能を実現
日本の AI スタートアップ Sakana AI が、複数のモデルを動的に調整する『Fugu』システムを発表。Anthropic の Fable 5・Mythos と同等の性能を実現し、特定ベンダーへの依存を避けるベンダーロック・イン対策が特徴です。
日本の AI スタートアップ Sakana AI が、複数の言語モデルを動的に調整する新しいシステム「Fugu」を発表しました。Anthropic の最先端モデル Fable 5 や Mythos Preview と同等の性能を実現しながら、特定ベンダーへの依存を減らす設計が注目されています。
Fugu システムが実現すること
Fugu は「マルチLLMオーケストレータ」と呼ばれるシステムで、ユーザー側からは単一のモデルのように見えます。OpenAI 互換の API を通じてアクセスでき、バックエンド内部では複雑な判断が行われています。
タスクの内容に応じて、システムが自動的に判断します。単純なタスクなら自力で処理し、複雑な問題が来たら複数の特化したモデルをチーム編成して対応するという仕組みです。この柔軟な設計により、コストと性能のバランスを取りながら高い精度を維持できます。
ベンチマーク結果で Fable 5 と競合
Sakana AI が公表したベンチマーク結果は業界注目です。ソフトウェアエンジニア能力を測定する「SWE Bench Pro」では、Fugu Ultra が 73.7% を達成。これは Claude 3.5 Sonnet(Opus 4.8)の 69.2% を上回り、Gemini 3.1 Pro の 54.2% も圧倒しています。
知識推論テスト「GPQA-D」では Fugu Ultra が 95.5% を記録し、Opus 4.8 の 92.0% を上回りました。重要な注釈として、Anthropic の Fable 5・Mythos はまだ公開されていないため、正式なベンチマーク比較は行われていません。ただし、Sakana AI が「同等性能」と主張する根拠は十分に説得力があります。
開発者からの高評価
ベータテストに参加した約 500 人の開発者からは肯定的なフィードバックが寄せられています。特に注目されるのは「長く複雑なワークフロー」での性能です。あるソフトウェア開発者は「Fugu Ultra は従来ツールの 20 倍以上のバグを検出した」と述べており、プロフェッショナルな開発環境での活用が期待されています。
ベンダーロック・イン対策が最大の特徴
Fugu の最大の強みは、その設計哲学にあります。モデルプール内部が「完全に交換可能」な構造になっており、特定プロバイダへのアクセスが制限されても、別のモデルに切り替えられます。
これは現在のジオポリティカルな課題と直結しています。最近、Anthropic が規制措置の対象になっているように、特定企業の API への依存は重大なリスクになり得ます。Fugu のアプローチは、このようなリスクを最小化しながら最先端のモデル性能を享受できる、実用的な戦略を示唆しています。
実用的な選択肢
Fugu は 2 つのバリエーションで提供されます。基本版は低遅延と日常的なタスクに最適化され、Fugu Ultra は AI 研究、セキュリティ分析、特許検索など複雑で高精度が求められる作業向けです。
開発者が今日から試験できるようになる実装モデルでもあり、マルチモデルオーケストレーション技術が実務レベルで機能することを示す重要な事例になっています。