Inception Labs’ Mercury 2 erreicht 90% auf dem AIME 2026 und ist besser als Googles DiffusionGemma

Am Donnerstag (18. Juni) hat Inception Labs Mercury 2 vorgestellt und es als das weltweit schnellste Reasoning-Sprachmodell bezeichnet, das ungefähr 1.000 Tokens pro Sekunde erzeugt. Laut der Ankündigung des Unternehmens erzielte Mercury 2 90% bei AIME 2026 (Aufgaben der American Invitational Mathematics Examination), verglichen mit Googles DiffusionGemma mit 69,1% in demselben Benchmark. Das Modell erreichte außerdem 77% bei GPQA, einem Science-Benchmark auf PhD-Niveau. Augment Code, ein Unternehmen für KI-Coding-Agents, berichtete von einer 82%-igen Verringerung der Latenz und 90%-igen Kostensenkung, nachdem Mercury 2 gegen Anthropics Claude Opus 4.7 ausgetauscht wurde, wobei die Ausgabequalität beibehalten wurde.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare