MiniMax phát hành Báo cáo kỹ thuật M2; Hệ thống Forge đạt mức tăng tốc huấn luyện 40 lần

Theo Beating, MiniMax đã công bố báo cáo kỹ thuật M2 trên arXiv, nêu chi tiết kiến trúc MoE (mixture-of-experts) chủ lực và hệ thống huấn luyện tác nhân Agent mang tên Forge. Công ty tiết lộ Forge tối ưu hóa học tăng cường bằng tác nhân cho ngữ cảnh dài thông qua kỹ thuật lập lịch FIFO theo cửa sổ (windowed FIFO scheduling) và gộp cây tiền tố (prefix-tree merging), đạt mức tăng tốc huấn luyện lên đến 40 lần.

M2.7 thể hiện năng lực tự tiến hóa của tác nhân tự động, hoàn thành hơn 100 vòng phân tích, cập nhật mã và thử nghiệm. Ở các bài đo hiệu năng, M2.7 đạt 56,22% trên SWE-Pro và 52,7% trên Multi-SWE-bench, với tỷ lệ phần thưởng trung bình 66,6% trên MLE Bench, tiến gần mức hiệu năng của Gemini 3.1.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.
Bình luận
0/400
Không có bình luận