OpenRouterのFusion APIは、Claude Fable 5の性能に匹敵し、コストは半分です

DEEPSEEK-4.31%

OpenRouterは6月12日にFusionを立ち上げました。サーバーサイドAPIで、プロンプトを複数のAIモデルに並列配信し、次にジャッジモデルとシンセサイザーを使って回答を統合した単一の答えにまとめます。同社は、PerplexityのDRACOベンチマークを用いたテストに基づき、FusionがClaude Fable 5の性能にほぼ半額のコストで匹敵できると主張しています。具体的には、モデルの予算パネルが64.7%を獲得し、Fable 5の65.3%に対した結果でした。今回のローンチは先週、AnthropicがFable 5とMythos 5を停止した直後に行われました。停止は、争点のあるジェイルブレイク発見を根拠にした米国の輸出管理指令によるもので、OpenRouterはFusionを「Fableレベルのインテリジェンスを半額で」という代替案として位置づけています。

OpenRouter Fusionはマルチモデル・パネル方式でプロンプトを処理します

ユーザーがFusionにプロンプトを送ると、OpenRouterはそれを複数のモデルからなるパネルに並列配信し、各モデルにはウェブ検索とbashツールが提供されます。続いてジャッジモデルが、すべての回答からコンセンサスポイント、矛盾、盲点を抽出します。この分析フェーズの後、シンセサイザー(デフォルトではClaude Opus 4.8)が、その分析に基づいて最終回答を書き上げます。プロセス全体はサーバーサイドで行われます。ユーザーはモデル文字列を「openrouter/fusion」に切り替えてデフォルトのパネルを使ったり、自分のモデル呼び出しで必要に応じてそれを呼び出せるようにfusionツールを追加したり、コードなしでFusionのチャットルーム内でカスタムパネルを構築したりできます。

予算AIパネルはDRACOベンチマークでFable 5の65.3%に対し64.7%を獲得

OpenRouterは、PerplexityのベンチマークであるDRACOでFusionをテストしました。DRACOは実際のユーザーによる深いリサーチ依頼から構築されています。Fable 5はOpenAIのGPT-5.5と組み合わせ、Opusが合成して、69%でチャートのトップに立ちました。ソロのFableは65.3%でしたが、その100タスクのうち7つは、ソロ側のコンテンツフィルターがそれらをブロックしたため実行されませんでした。Gemini 3 Flashとオープンソースの中国モデルKimi K2.6、DeepSeek V4 Proを組み合わせ、Opusで合成した予算の組み合わせは64.7%に到達し、ソロのGPT-5.5(60%)とソロのOpus 4.8(58.8%)を上回り、さらに「Fableがほぼ半額」という状況でのFableと1ポイント以内に収まりました。Opus 4.8をそれ自体の別インスタンスと組み合わせると65.5%となり、ソロのOpusを6.7ポイント上回りました。OpenRouterは、この改善の約4分の3はシンセシスステップそのものによるもので、残りは本物の意味でのモデル多様性によるものだと述べています。

OpenRouterは、パネルにライブのウェブアクセスを与えることで、モデルが検索結果内にDRACO固有の採点ルーブリックを提示できるようになり、そのことが汚染リスクになると明らかにしました。同社は、それを意図的ではなく偶然だと呼んでいます。修正には、検索ツールからベンチマークのホスティングドメインを除外するための1行の設定が必要で、掲載されている各数値はそのクリーニング後の実行内容を反映しています。

Anthropicは米国の輸出指令を受け、Fable 5とMythos 5を停止

先週Fable 5とMythos 5をリリースした直後に、米国の輸出管理指令によって、Anthropicはそれらのモデルを世界中のすべての外国籍の個人に対して停止せざるを得なくなりました。争点のあるジェイルブレイク発見を根拠にしており、そのため世界中で誰もが利用できなくなる影響が出ました。OpenRouterは6月13日にXでFusionを発表し、「Fableレベルのインテリジェンスを半額で」という約束とともに代替案として位置づけました。

OpenRouterはコーディングと長期ホライゾン課題におけるFusionの制限を特定

OpenRouterは、FusionはFableの完全な代替ではないと述べています。DRACOは長期ホライゾンの作業を飛ばし、そこでは(報告によれば)Fableが依然としてリードしています。コーディングについては、Fusionはコーディングモデルが選択的に呼び出すツールとして機能し、全面的な置き換えではありません。ローンチスレッドは、センチメントの追跡でおよそ2対1で肯定的に分かれました。AI研究者のAndrew Traskは、それを「見た目以上にずっと大きな出来事」と呼び、フロンティア・ラボが今後二度とフロンティアを単独で所有することはないだろうと主張しました。懐疑派は、悪いコーディング結果、貧弱なツール呼び出し、そしてFable 5が利用できなくなったため結果を比較するための透明性の欠如を挙げました。FusionはOpenRouterの自社インフラを通じてルーティングされたモデル上で完全に動作するため、輸出管理の問題を根本の場所では解決しません。

FAQ

OpenRouterは6月12日に何をローンチしましたか?

OpenRouterは6月12日にFusionをローンチしました。サーバーサイドAPIで、プロンプトを複数のAIモデルに並列配信し、次にジャッジモデルとシンセサイザーを使って回答を統合した単一の答えにまとめます。

Fusionの予算パネルはDRACOベンチマークでClaude Fable 5と比べてどうでしたか?

PerplexityのDRACOベンチマークで、Fusionの予算パネルはGemini 3 Flash、Kimi K2.6、DeepSeek V4 Proを組み合わせて64.7%を獲得しました。ソロのFable 5の65.3%スコアに対して、およそ1ポイント以内に収まり、コスト面でもほぼ半額の水準でした。

なぜAnthropicはClaude Fable 5とMythos 5を停止したのですか?

Anthropicは、争点のあるジェイルブレイク発見を根拠にした米国の輸出管理指令に続いて先週Fable 5とMythos 5を停止しました。これにより、世界中のすべての外国籍の個人に対するアクセスが影響を受けました。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし