Theo Beating, MiniMax đã công bố báo cáo kỹ thuật M2 trên arXiv, nêu chi tiết kiến trúc MoE (mixture-of-experts) chủ lực và hệ thống huấn luyện tác nhân Agent mang tên Forge. Công ty tiết lộ Forge tối ưu hóa học tăng cường bằng tác nhân cho ngữ cảnh dài thông qua kỹ thuật lập lịch FIFO theo cửa sổ (windowed FIFO scheduling) và gộp cây tiền tố (prefix-tree merging), đạt mức tăng tốc huấn luyện lên đến 40 lần.
M2.7 thể hiện năng lực tự tiến hóa của tác nhân tự động, hoàn thành hơn 100 vòng phân tích, cập nhật mã và thử nghiệm. Ở các bài đo hiệu năng, M2.7 đạt 56,22% trên SWE-Pro và 52,7% trên Multi-SWE-bench, với tỷ lệ phần thưởng trung bình 66,6% trên MLE Bench, tiến gần mức hiệu năng của Gemini 3.1.