إصدار تقرير M2 التقني من MiniMax؛ نظام Forge يحقق زيادة في سرعة التدريب بمقدار 40 مرة

وفقاً لـBeating، أصدرت MiniMax تقريرها التقني M2 على arXiv، موضحةً بالتفصيل بنية MoE الرائدة (mixture-of-experts) ونظام تدريب الوكلاء Forge. كشفت الشركة كيف يعمل Forge على تحسين تعلّم تعزيز الوكلاء عبر سياقات طويلة من خلال جدولة FIFO مجزأة بتقنية windowed وطرق دمج شجرة البادئات، محققاً ما يصل إلى 40 ضعفاً في سرعة التدريب.

أظهر M2.7 قدرات على التطور الذاتي للوكلاء بشكل مستقل، من خلال إتمام أكثر من 100 جولة من دورات التحليل وتعديل الكود والاختبار. وعلى اختبارات الأداء، حقق M2.7 نسبة 56.22% على SWE-Pro و52.7% على Multi-SWE-bench، مع معدل مكافأة متوسط يبلغ 66.6% على MLE Bench، مقترباً من مستويات أداء Gemini 3.1.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات