Inception Labs 的 Mercury 2 在 AIME 2026 上达成 90%,胜过 Google 的 DiffusionGemma

在周四(6 月 18 日),Inception Labs 揭晓了 Mercury 2,称其为世界最快的推理语言模型,生成速度约为每秒 1,000 个 token。根据公司的公告,Mercury 2 在 AIME 2026(美国数学邀请赛)上取得了 90%,而谷歌的 DiffusionGemma 在同一基准上为 69.1%。该模型在 GPQA 上也取得了 77%,该基准为博士级科学测试。AI 编程代理公司 Augment Code 表示,在将 Mercury 2 替换为 Anthropic 的 Claude Opus 4.7 后,延迟降低了 82%,成本降低了 90%,并维持了输出质量。
免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论