根據 Beating,MiniMax 已在 arXiv 發布其 M2 技術報告,詳細說明其旗艦型 MoE(mixture-of-experts,混合專家)架構與 Agent 訓練系統 Forge。該公司披露 Forge 如何透過分段的 FIFO(先進先出)排程以及前綴樹合併技術,優化長上下文的 Agent 強化學習,並達到最高 40 倍的訓練加速。
M2.7 展示了自主代理自我進化能力,完成超過 100 輪的分析、程式碼修訂與測試循環。在效能基準測試上,M2.7 在 SWE-Pro 上達到 56.22%,在 Multi-SWE-bench 上達到 52.7%,並在 MLE Bench 上取得 66.6% 的平均獎勵率,接近 Gemini 3.1 的效能水準。