Tilde Research يكتشف أن مُحسّن الميون يقتل 25% من الخلايا العصبية؛ ويحقق بديل Aurora مكسبًا في كفاءة البيانات بمقدار 100 ضعف

GateNews

2026-05-10 03:53:34

وفقاً لـ Tilde Research، يعاني مُحسّن Muon الذي اعتمدته نماذج ذكاء اصطناعي رائدة، بما في ذلك DeepSeek V4 وKimi K2.5، من عيبٍ خفي: إذ يتسبب في موتٍ دائم لأكثر من 25% من عصبونات طبقات MLP خلال التدريب المبكر. صممت المجموعة Aurora، وهو مُحسّن بديل، وقامت بإتاحته مفتوح المصدر. وقد حقق نموذج بمعلمات 1.1B تم تدريبه باستخدام 100B فقط من الرموز أداءً مطابقاً لأداء Qwen3-1.7B الذي تم تدريبه على 36T من الرموز عبر معايير فهم اللغة مثل HellaSwag وWinogrande، ما يوضح تحسناً تقريبيّاً في كفاءة البيانات بنسبة 100x. تضيف Aurora حملاً حسابياً إضافياً بنسبة 6% مقارنةً بـ Muon، ويمكن استخدامها كبديل مباشر.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

05-10 01:55

TeraWulf تنشر خسارة $427M في الربع الأول مع قفزة إيرادات الحوسبة بالذكاء الاصطناعي بنسبة 117%، وتتجاوز تعدين Bitcoin

05-09 11:17

يحقق مساعدٌ رياضيٌ مشترك بالذكاء الاصطناعي من Google DeepMind نسبة 47.9% في المستوى 4 من FrontierMath، متفوقًا على GPT-5.5 Pro، ويحل ثلاث مسائل كانت دون حل سابقًا

05-09 09:54

نظام مكافآت OpenAI يسجل سلاسل التفكير بالخطأ على 6 نماذج، بما في ذلك GPT-5.4

05-09 07:41

تقوم شركة MiniMax بفحص 200 ألف رمز، وتكتشف انخفاضاً بنسبة 4.9% في نماذج السلسلة M2

05-09 05:52

يخطط Deepseek لإجراء تحديث على نموذج V4 ليصدر في يونيو

تحليل متعمق

مسح مجلس الاحتياطي الفيدرالي يُظهر تصاعد مخاوف الذكاء الاصطناعي عبر الأسواق والائتمان والوظائف

Coinpedia05-10 03:39

حصلت شركة Deepinfra، الشريك طويل الأمد في مجال الذكاء الاصطناعي المفتوح التابع لـ NVIDIA، على تمويل جولة B بقيمة 107 مليون دولار، بهدف إنشاء «مصنع رموز».

ChainNewsAbmedia05-10 00:04

كشفت OpenAI عن تأثير غير متوقع لتقييمات سلسلة التفكير (CoT): الحفاظ على مراقبة سلسلة الأفكار يعد خط الدفاع الحاسم لمحاذاة وكلاء الذكاء الاصطناعي

ChainNewsAbmedia05-09 07:34

تعليق

0/400

لا توجد تعليقات