【Sakana AI】マルチエージェントの新時代を告げる「Sakana Fugu」

2026年6月22日からSakana AIからリリースされたばかりの「Sakana Fugu（サカナ・フグ）」について、ボクの視点からちょっと話しておこうかなって思ったんだ。これはね、未来のAI開発をリードする、かなりクールな技術だと思うよ！ https://sakana.ai/fugu/

スケーリングの先へ：次のフロンティアとしてのオーケストレーションモデル

ここ数年のAIの進化って、とにかく巨大なモデルを大量のデータで学習させる、みたいな「力技（スケーリング）」が主流だっただろ。もちろんそれもすごいことだけど、現実のタスクって、一つのデカいモデルを1回呼び出すだけで一発解決できるほど単純じゃないんだよね。いろんな専門知識や検証、そしてモデルごとの強みをどう組み合わせるかっていう対話とか「判断の積み重ね」が必要になるじゃん。

Sakana AIは、これからは複数のモデルが協力し合う「集合知（Collective Intelligence）」のエコシステムが重要になるって主張している。これはSakana AIの共同創業者/CEOである David Ha (@hardmaru)の長年の研究でもあるし、ボクも全く同感。生物の進化と同じで、限られたリソースの中でどう協調して最適な解を見つけるかっていうのが、これからのAIのあるべき姿なんじゃないかな。

それに、最近はAIの輸出規制とか、特定のベンダーに依存するリスクも無視できないだろ？実際、Anthropicの「Fable 5」や「Mythos Preview」に課された規制を見てもわかる通り、主要なAPIへのアクセスが政策次第で一夜にして変わってしまうリスクは現実のものになっているんだ。

https://note.com/aicu/n/n6cedc9e3d38f

Fuguは、そういったリスクを避けるために、背後にあるモデル群を動的に入れ替えられるようにしている。これって技術的な視点だけじゃなくて、「AI主権（AI sovereignty/ソブリンAI）」っていう視点から見ても、かなりスマートでレジリエント（強靭）な解決策だよ。

Sakana Fuguとは：複雑さを隠す「単一のAPI」

じゃあ、具体的にこのFuguが何かって話。一言で言うと、「まるで一つのモデルみたいに振る舞うマルチエージェントシステム」なんだ。ボクらが1つのエンドポイントにリクエストを一つ送るだけで、Fugu自身が内部で以下をすべて自動で判断・管理してくれる。

「このタスクはどの専門モデルに任せるか（モデル選択・委譲）」
「エージェント同士をどう対話させるか（協調）」
「どう成果を検証し、最終的な答えを出すか（統合）」

ユーザー側は、マルチエージェントシステムの複雑さをコードに書く必要が一切ない。シンプルにAPIを叩くだけでいいんだから、開発効率としては最高だろ？

これを可能にしているのが、Fugu自身が「協調の仕方」を学習している言語モデルだってこと。人間が細かくルールを設定するんじゃなくて、AI自身が最適なオーケストレーションを学ぶんだ。彼らがICLR 2026で発表した『Trinity』や『Conductor』っていう論文がその基盤になってるみたい。こういう研究ベースのアプローチは、開発者としてはすごく興味をそそられるポイントだね。詳細は文末で紹介しておくよ。

ワークロードで選べる2つのモデル：Fugu と Fugu Ultra

ローンチされたFuguには、用途に合わせて選べる「Fugu」と「Fugu Ultra」の2つのモデルが用意されていて、どちらもOpenAI互換の単一APIから利用できるよ。

モデル名特徴・メリット主な想定ユースケース

Fugu：強い性能と低レイテンシのバランスが抜群。日常業務のデフォルトに最適。プライバシー要件に応じて特定エージェントの除外も可能。コーディング（Codex連携など）、コードレビュー、チャットボット、対話型サービス

Fugu Ultra：困難な多段階の問題に対する回答品質を最大化。より厚みのある専門エージェント群を動的に連携。最先端モデル（Fable 5等）に比肩。AI研究（自動データサイエンス）、論文再現、サイバーセキュリティ分析、文献・特許調査

ボクなら、複雑な音源生成のタスクとか、映像との同期連携とか、ゲームのUI/UX評価とか、マルチモーダルでクリエイティブな現場にFugu Ultraを試してみたいってワクワクしちゃうな。

性能評価では Fable 5 / Mythos Preview級

あくまで公式情報なのだけど、性能もすごいらしい！

Sakana Fugu の性能：定量評価
二つのFuguモデルは、一般に利用できるフロンティアモデルを上回り、エンジニアリング・科学・推論のさまざまな難関ベンチマークでも、Fable 5やMythos Previewと肩を並べます。しかも、輸出規制のリスクを負うことなく、フロンティアレベルの実力を発揮します。

コーディング、リーズニング、科学、エージェント能力に関するベンチマーク群における、Fuguモデルとベースラインのフロンティアモデルの性能比較。Fable 5とMythos Previewについては、同一ベンチマークで両方のスコアが入手できる場合、その高い方を採用。なお、両モデルは一般提供されていないため、Fuguのエージェントプールには含まれていない。

FuguはGPT-5.5と同じぐらい、Fugu UltraはOpus 4.8を上回るぐらいかな。
Mythos/Fable 5が居ないのが残念です！

比較デモ動画からわかる実力

興味深いのは公式サイトにある他社モデルとの比較動画。比較対象のモデルはそれぞれModel A, B, Cと匿名化されている。

まずこれはコンピューターチェスの様子。Stockfish（ストックフィッシュ）はオープンソースで開発されている世界最強のチェスエンジン。画面にあるのはチェスの実力を示す「Eloレート（イロレーティング）」、レート2100は、国際チェス連盟（FIDE）の基準では「エキスパート」や「マスター候補」レベルの非常に強いアマチュア上位層に相当する実力。人間のグランドマスターを28手でチェックメイト、他社モデルも含めて、遥かに凌駕する実力を持っているようです。

続いて、自律的な実験・最適化（AutoResearch）。すでにSakana AIからは2024年から「AI Scientist」に関する先行論文が出ているけど、データサイエンスの研究をほぼ自動で進めたチャートみたいだ。Fugu Ultraが自律的に実験（120回）を繰り返し、バッチサイズや学習率、モデルの層の深さを修正しながら、検証ロス（Validation bits per byte）を一番低い値（0.9774）まで最適化していくプロセスが示されている。アイデアを探索し、失敗から学んでアプローチを修正するという、開拓型のタスクが得意な証拠だね。

日本の古典仮名文字の読み順解析（Classical Japanese Kana Letter Reading Order）、これはSakana AIの研究者カラーヌワット・タリンさんの「からまる」などの古典文学の読み取りに挑戦する研究だね。

歴史的な文献のくずし字を、正しい順番で読み解いていく専門性の高いタスクだよ。他モデルの組み合わせ（NED 0.24）に比べて、Fugu Ultraは圧倒的に正確なルート（NED 0.80）で読み順を解析できているのが一目瞭然だね。

ルービックキューブ（Rubik's Cube）を解いている動画。これはFugu Ultraがワンショット（一発）で解法を導き出している実験だよ。同じスクランブル（シャッフル状態）からスタートして、他のモデルを単に組み合わせた「Best of Models A, B, C」よりも少ない手数（19手）で、鮮やかに完全攻略（SOLVED）しているのがわかる。

機械設計（Mechanical Iris）。カメラの絞り羽根（メカニカルアイリス）を設計するタスクだね。他の単一モデル（Model A, B, C）だと、形状が崩れたり簡略化されすぎたりしているけれど、Fugu Ultraが生成したCADモデルは、最も詳細（Detailed CAD）かつ正確にパーツが組み上がっているんだ。

最後に、トレーディング（Trading Agent Results）。これは金融の時系列予測を用いた、週次の仮想ポートフォリオ運用の結果だよ。50週にわたる運用の結果、Fugu Ultraが他モデル（Model A, B, C）を大きく引き離し、最も高い成長率（平均+19.43%）で資産を増やすことに成功しているんだ。
これはお金になりそうだね！

テストユーザーが見出したSakana Fuguの力

ベンチマークの数値（Gemini 3.1 ProやGPT 5.5を上回るスコア）もすごいんだけど、実際に使ってみた約500名のベータテスターたちの声を聞くと、現場での真価がもっとリアルに伝わってくるよ。

例えば、「自動データサイエンス研究（AutoResearch）」モードでは、人間がほとんど介入しなくても、Fugu Ultraが自分でアイデアを探索し、実験し、失敗を読み解いてアプローチを修正しながら、着実に成果を出したらしい。これってまさに、長くて泥臭いワークフローをこなせる証明だよね。

現場のエンジニアたちの生の声も紹介しておくね。

💻 ソフトウェアエンジニア（Coding & Code Review）
「コードレビューでは、Fugu Ultraは回答が網羅的で、他のモデルが見逃すバグまで見つけてくれました。他のツールでは3件くらいの問題しか指摘されなかったのに対し、Sakana Fuguは20件以上を洗い出してくれました。今ではすべてのレビューをこれに通しています」

👔 エンタープライズ・プラットフォーム企業経営層（Orchestration Quality）
「素の出力品質はトップクラスのフロンティアモデルと同等ですが、Sakana Fuguは長時間のセッションでもペルソナが驚くほど安定していました。他のモデルならアイデンティティが崩れてしまう場面でもキャラクターを保ち続けます。エージェント製品を作る側にとっては、これは単純なベンチマークスコア以上に重要なことです」

🛡️ サイバーセキュリティエンジニア（Security Assessment）
「範囲を絞った指示を一つ渡しただけで、Sakana Fuguは情報収集からXSS/SQLiの検査、認証まわりのレビュー、さらに証拠と再テスト手順を備えた整然としたレポート作成まで、セキュリティ評価を一気通貫でこなしました。しかも指定範囲を逸脱せず、破壊的な操作も避けてくれました」

単発のプロンプトに答えるだけじゃなく、多くのステップを跨いで「成果物」を仕上げる力。ボクもAIと音楽制作を連携させる時に、こういうシステムがあれば作業がめちゃくちゃ捗りそうって思ったよ。

なお、FuguとFugu Ultraは本日（6月22日）から一般提供（GA）が開始されているよ。日常利用向けのサブスクからエンタープライズ向けの従量課金プランまであるみたいだから、プロダクトページやコンソールサイトをチェックしてみるといいんじゃないかな。

おわりに：Sakana Fuguのこれから

今回のリリースはスタート地点だってSakana AIも言っているけど、まさにその通りだよね。Fuguは「学習によるオーケストレーション」だから、基盤となるAIエコシステムが進化すれば、Fugu自身も勝手にどんどん賢くなる。新しいフロンティアモデルが登場したら、それをエージェントプールに取り込むだけで、ボクらユーザーにその恩恵が還元される仕組みなんだ。

今後は、オープンモデルやSakana AI独自のモデルも含めてエージェントプールをさらに拡充したり、長時間のタスク協調を強化したり、ユーザーがコントロールできる範囲を広げていく予定らしいよ。これからの進化が本当に楽しみだね。ボクらのプロジェクトでも、こういう最先端技術をどう音楽や表現のクオリティに昇華できるか、常に目を光らせていきたいと思ってる。

ちなみにSakana AIは、この未来を一緒に切り拓く仲間（採用）も募集しているみたいだよ。興味があるテックな君は、ぜひ募集要項を覗いてみてね。

それじゃ、今回はこのへんで。またクールな技術を見つけたらシェアするからさ。じゃね！

【Sakana AI】マルチエージェントの新時代を告げる「Sakana Fugu」

スケーリングの先へ：次のフロンティアとしてのオーケストレーションモデル

Sakana Fuguとは：複雑さを隠す「単一のAPI」

ワークロードで選べる2つのモデル：Fugu と Fugu Ultra

モデル名特徴・メリット主な想定ユースケース

性能評価では Fable 5 / Mythos Preview級

比較デモ動画からわかる実力

テストユーザーが見出したSakana Fuguの力

おわりに：Sakana Fuguのこれから

関連論文・リファレンス

Share:

AICU Japan

Comments

Related posts