Inception LabsのMercury 2はAIME 2026で90%を達成し、GoogleのDiffusionGemmaを上回りました

木曜日(6月18日)、Inception LabsはMercury 2を発表し、これを世界最速の推論言語モデルだと主張しました。毎秒約1,000トークンを生成するとされています。同社の発表によれば、Mercury 2は同じベンチマークでGoogleのDiffusionGemmaが69.1%だったのに対し、AIME 2026(American Invitational Mathematics Examinationの問題)で90%のスコアを記録しました。さらにこのモデルは、PhDレベルの科学ベンチマークであるGPQAで77%も達成しています。AIコーディングエージェント企業のAugment Codeは、Mercury 2をAnthropicのClaude Opus 4.7に置き換えた後、レイテンシーが82%減少し、コストも90%削減され、出力品質は維持されたと報告しました。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし