Mercury 2 d’Inception Labs atteint 90% sur l’AIME 2026, dépassant DiffusionGemma de Google

Le jeudi 18 juin, Inception Labs a dévoilé Mercury 2, le présentant comme le modèle de langage de raisonnement le plus rapide au monde, générant environ 1 000 tokens par seconde. D’après l’annonce de l’entreprise, Mercury 2 a obtenu 90 % à l’AIME 2026 (problèmes de l’American Invitational Mathematics Examination), contre 69,1 % pour DiffusionGemma de Google sur le même benchmark. Le modèle a aussi atteint 77 % sur GPQA, un benchmark scientifique de niveau doctorat. Augment Code, une entreprise d’agents de codage IA, a déclaré une réduction de 82 % de la latence et de 90 % des coûts après avoir remplacé Mercury 2 par Claude Opus 4,7 d’Anthropic, tout en conservant la qualité des sorties.
Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire