OpenRouter Fusion API erreicht die Performance von Claude Fable 5 zu einem halben Preis

DEEPSEEK-4,31%

OpenRouter hat am 12. Juni Fusion gestartet: eine serverseitige API, die Prompts parallel an mehrere KI-Modelle verteilt und anschließend ein RichtermodeI sowie einen Synthesizer nutzt, um Antworten zu einer einheitlichen Antwort zusammenzuführen. Das Unternehmen behauptet, das System könne die Leistung von Claude Fable 5 zu ungefähr der Hälfte der Kosten erreichen, basierend auf Tests mit Perplexity's DRACO-Benchmark, bei dem ein Budget-Panel von Modellen 64,7% erreichte, verglichen mit 65,3% für Fable 5. Der Launch erfolgte kurz nachdem Anthropic letzte Woche Fable 5 und Mythos 5 ausgesetzt hatte, nachdem es aufgrund einer US-Exportkontroll-Anweisung, die auf einer umstrittenen Jailbreak-Feststellung beruhte, suspendiert wurde. OpenRouter positioniert Fusion als Alternative mit dem Versprechen „Fable-Level-Intelligenz zum halben Preis“.

OpenRouter Fusion verarbeitet Prompts über Multi-Model-Panel-Architektur

Wenn ein Nutzer einen Prompt an Fusion sendet, verteilt OpenRouter ihn parallel an ein Panel von Modellen, wobei jedes Modell Web-Search- und Bash-Tools erhält. Ein RichtermodeI extrahiert anschließend Konsenspunkte, Widersprüche und blinde Flecken aus jeder Antwort. Nach dieser Analysephase schreibt ein Synthesizer – standardmäßig Claude Opus 4,8 – die finale Antwort auf Basis dieser Analyse. Der gesamte Prozess läuft serverseitig. Nutzer können ihre Modellzeichenkette auf „openrouter/fusion“ umstellen, um ein Standard-Panel zu verwenden, ein Fusion-Tool hinzufügen, damit ihr eigenes Modell es selektiv aufruft, oder ein benutzerdefiniertes Panel im Fusion-Chatroom ohne Code erstellen.

Budget-KI-Panel erzielt 64,7% auf dem DRACO-Benchmark gegen Fable 5 mit 65,3%

OpenRouter hat Fusion auf DRACO getestet, dem Benchmark von Perplexity, der aus echten Deep-Research-Anfragen von Nutzern zusammengestellt wurde. Fable 5, gepaart mit OpenAI's GPT-5,5 und von Opus synthetisiert, führte die Tabelle mit 69% an. Solo Fable erzielte 65,3%, obwohl sieben seiner 100 Aufgaben nie ausgeführt wurden, weil die eigenen Content-Filter sie blockierten. Die Budget-Kombination aus Gemini 3 Flash, kombiniert mit Open-Source-chinesischen Modellen Kimi K2,6 und DeepSeek V4 Pro, fusioniert und von Opus synthetisiert, erreichte 64,7% – und schlug damit Solo GPT-5,5 (60%) und Solo Opus 4,8 (58,8%) und lag innerhalb eines Prozentpunkts von Fable bei ungefähr der Hälfte der Kosten. Das Pairing von Opus 4,8 mit einer separaten Instanz desselben Modells erzielte 65,5%, ein Sprung um 6,7 Prozentpunkte gegenüber Solo Opus. OpenRouter gibt an, dass ungefähr drei Viertel dieser Verbesserung auf den Synthese-Schritt selbst zurückzuführen sind, der Rest auf echte Modellvielfalt.

OpenRouter hat offengelegt, dass die Live-Web-Zugriffe für das Panel es Modellen ermöglichen, das eigene DRACO-Bewertungsraster in den Suchergebnissen aufzuzeigen, was das Unternehmen als zufällige Kontamination statt als absichtliche bezeichnet. Die Lösung erforderte eine einzige Konfigurationszeile, um die Hosting-Domains des Benchmarks von den Such-Tools auszuschließen, und jede veröffentlichte Zahl spiegelt diesen bereinigten Lauf wider.

Anthropic setzte Fable 5 und Mythos 5 nach US-Exportanweisung aus

Kurz nachdem das Unternehmen letzte Woche Fable 5 und Mythos 5 veröffentlicht hatte, zwang eine US-Exportkontroll-Anweisung Anthropic dazu, diese Modelle für jede ausländische Person weltweit auszusetzen, mit Verweis auf eine umstrittene Jailbreak-Feststellung. OpenRouter kündigte Fusion am 13. Juni auf X an und positionierte es als Alternative mit dem Versprechen von „Fable-Level-Intelligenz zum halben Preis“.

OpenRouter identifiziert Fusion-Limitierungen für Coding- und Long-Horizon-Aufgaben

OpenRouter erklärt, Fusion sei kein vollständiger Ersatz für Fable. DRACO überspringt langfristige Arbeiten, bei denen Fable Berichten zufolge weiterhin die Nase vorn hat. Für das Programmieren funktioniert Fusion als Tool, das ein Coding-Modell selektiv aufruft, nicht als vollständiger Ersatz. Der Launch-Thread teilte sich ungefähr zu zwei Dritteln bis eins positiv in der Sentiment-Verfolgung. KI-Forscher Andrew Trask nannte es „eine deutlich größere Sache, als es den Anschein hat“, und argumentierte, dass Frontier-Labs das Frontier künftig nie wieder allein besitzen werden. Skeptiker verwiesen auf schlechte Coding-Ergebnisse, mangelhafte Tool-Aufrufe und mangelnde Transparenz, seit Fable 5 nicht mehr verfügbar sei, um Ergebnisse zu vergleichen. Fusion läuft vollständig auf Modellen, die über die eigene Infrastruktur von OpenRouter geroutet werden, sodass es das Exportkontroll-Problem nicht an der Quelle adressiert.

FAQ

Was hat OpenRouter am 12. Juni gestartet?

OpenRouter hat Fusion am 12. Juni gestartet: eine serverseitige API, die Prompts parallel an mehrere KI-Modelle verteilt und anschließend ein RichtermodeI sowie einen Synthesizer nutzt, um Antworten zu einer einheitlichen Antwort zusammenzuführen.

Wie gut hat sich das Budget-Panel von Fusion im DRACO-Benchmark im Vergleich zu Claude Fable 5 geschlagen?

Beim DRACO-Benchmark von Perplexity erzielte das Budget-Panel von Fusion, das Gemini 3 Flash, Kimi K2,6 und DeepSeek V4 Pro kombiniert, 64,7% und lag damit innerhalb eines Prozentpunkts von der Punktzahl des Solo Fable 5 (65,3%) bei ungefähr der Hälfte der Kosten.

Warum hat Anthropic Claude Fable 5 und Mythos 5 suspendiert?

Anthropuic setzte Claude Fable 5 und Mythos 5 letzte Woche nach einer US-Exportkontroll-Anweisung aus, die auf einer umstrittenen Jailbreak-Feststellung basierte, wodurch der Zugang für jede ausländische Person weltweit betroffen war.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare