OpenRouter Fusion API Mencocokkan Performa Claude Fable 5 dengan Biaya Setengah

DEEPSEEK-2,81%

OpenRouter meluncurkan Fusion pada 12 Juni, sebuah API sisi server yang mendistribusikan prompt ke beberapa model AI secara paralel, lalu menggunakan model hakim (judge model) dan penyintesis (synthesizer) untuk menggabungkan respons menjadi satu jawaban terpadu. Perusahaan mengklaim sistem ini dapat menyamai performa Claude Fable 5 dengan biaya kira-kira setengahnya, berdasarkan pengujian menggunakan benchmark DRACO dari Perplexity, di mana panel model dengan anggaran terbatas mencetak 64,7% dibandingkan skor Fable 5 sebesar 65,3%. Peluncuran ini datang tak lama setelah Anthropic menangguhkan Fable 5 dan Mythos 5 pekan lalu menyusul arahan kontrol ekspor AS yang mengutip temuan jailbreak yang disengketakan, dengan OpenRouter memposisikan Fusion sebagai alternatif yang menawarkan "kecerdasan setara Fable dengan harga setengah".

OpenRouter Fusion Memproses Prompt Melalui Arsitektur Panel Multi-Model

Saat pengguna mengirim prompt ke Fusion, OpenRouter mendistribusikannya ke sebuah panel model secara paralel, dengan setiap model menerima alat pencarian web dan bash. Model hakim kemudian mengekstrak poin-poin kesepakatan, kontradiksi, dan celah pengetahuan (blind spots) dari setiap respons. Setelah fase analisis ini, penyintesis—Claude Opus 4,8 secara default—menulis jawaban akhir berdasarkan analisis tersebut. Seluruh proses terjadi di sisi server. Pengguna dapat mengganti string model mereka menjadi "openrouter/fusion" untuk panel default, menambahkan tool fusion agar model mereka sendiri memanggilnya secara selektif, atau membuat panel kustom di ruang obrolan Fusion tanpa perlu kode.

Panel AI Anggaran Terbatas Skor 64,7% pada Benchmark DRACO, Mengungguli Fable 5 yang Skor 65,3%

OpenRouter menguji Fusion pada DRACO, benchmark Perplexity yang dibangun dari permintaan riset mendalam pengguna secara nyata. Fable 5 yang dipasangkan dengan GPT-5,5 dari OpenAI dan disintesis oleh Opus memuncaki bagan dengan 69%. Fable solo meraih 65,3%, meski tujuh dari 100 tugasnya tidak pernah berjalan karena filter konten miliknya memblokirnya. Kombinasi anggaran berupa Gemini 3 Flash digabungkan dengan model sumber terbuka Tiongkok Kimi K2.6 dan DeepSeek V4 Pro, lalu disatukan dan disintesis oleh Opus, mencapai 64,7%—mengalahkan GPT-5,5 solo (60%) dan Opus 4,8 solo (58,8%) serta berada dalam jarak satu poin persentase dari Fable dengan biaya kira-kira setengah. Saat Opus 4,8 dipasangkan dengan instans terpisah dari dirinya sendiri, skornya menjadi 65,5%, naik 6,7 poin dibanding Opus solo. OpenRouter menyatakan sekitar tiga perempat dari peningkatan tersebut berasal dari langkah sintesis itu sendiri, sisanya dari keberagaman model yang benar-benar berbeda.

OpenRouter mengungkapkan bahwa memberi panel akses web secara langsung memungkinkan model menampilkan rubrik penilaian DRACO sendiri dalam hasil pencarian, yang menurut perusahaan merupakan risiko kontaminasi namun menyebutnya kebetulan, bukan disengaja. Perbaikan membutuhkan satu baris konfigurasi untuk mengecualikan domain hosting benchmark dari alat pencarian, dan setiap angka yang dipublikasikan mencerminkan hasil lari yang sudah dibersihkan tersebut.

Anthropic Menangguhkan Fable 5 dan Mythos 5 setelah Arahan Kontrol Ekspor AS

Tak lama setelah merilis Fable 5 dan Mythos 5 pekan lalu, sebuah arahan kontrol ekspor AS memaksa Anthropic untuk menangguhkan model-model tersebut untuk setiap warga negara asing di seluruh dunia, dengan mengutip temuan jailbreak yang disengketakan. OpenRouter mengumumkan Fusion di X pada 13 Juni, memposisikannya sebagai alternatif dengan janji "kecerdasan setara Fable dengan harga setengah."

OpenRouter Mengidentifikasi Keterbatasan Fusion untuk Pekerjaan Koding dan Horizon Panjang

OpenRouter menyatakan bahwa Fusion bukan pengganti penuh Fable. DRACO melewatkan pekerjaan horizon panjang, area di mana Fable dilaporkan masih memimpin. Untuk koding, Fusion bekerja sebagai tool yang dipanggil secara selektif oleh model koding, bukan sebagai pengganti menyeluruh. Thread peluncuran terbelah kira-kira dua banding satu yang positif dalam pelacakan sentimen. Peneliti AI Andrew Trask menyebutnya "perkara yang jauh lebih besar daripada yang terlihat," dengan berpendapat bahwa lab-lab frontier tidak akan pernah lagi memiliki frontier sendirian. Para skeptis menyoroti hasil koding yang buruk, pemanggilan tool yang kurang baik, serta kurangnya transparansi karena Fable 5 sudah tidak tersedia untuk membandingkan hasil. Fusion berjalan sepenuhnya pada model yang dirutekan melalui infrastruktur milik OpenRouter sendiri, sehingga tidak menyelesaikan masalah kontrol ekspor di sumbernya.

FAQ

Apa yang diluncurkan OpenRouter pada 12 Juni?

OpenRouter meluncurkan Fusion pada 12 Juni, sebuah API sisi server yang mendistribusikan prompt ke beberapa model AI secara paralel, lalu menggunakan model hakim dan penyintesis untuk menggabungkan respons menjadi satu jawaban terpadu.

Bagaimana performa panel anggaran Fusion pada benchmark DRACO dibanding Claude Fable 5?

Pada benchmark DRACO dari Perplexity, panel anggaran Fusion yang menggabungkan Gemini 3 Flash, Kimi K2.6, dan DeepSeek V4 Pro meraih 64,7%, berada dalam jarak satu poin persentase dari skor 65,3% Fable 5 solo dengan biaya kira-kira setengah.

Mengapa Anthropic menangguhkan Claude Fable 5 dan Mythos 5?

Anthropuic menangguhkan Fable 5 dan Mythos 5 pekan lalu setelah arahan kontrol ekspor AS yang mengutip temuan jailbreak yang disengketakan, yang berdampak pada akses bagi setiap warga negara asing di seluruh dunia.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar