أصدرت DeepSeek ورقة جديدة موقعة من ليانغ وينفنغ: تقترح بنية mHC جديدة لتحسين استقرار تدريب النماذج الكبيرة

ذكرت PANews في 1 يناير أنه وفقا لجينشي، أصدرت DeepSeek ورقة بحثية جديدة تقترح بنية جديدة تسمى الاتصال الفائق المقيد متعدد الأوجه (mHC)، تهدف إلى حل مشاكل عدم استقرار التدريب وقابلية التوسع المحدودة الناتجة عن تدمير خصائص رسم الهويات في تقنية شبكات الاتصال الفائق (HC). تحقق هذه البنية تحسينات كبيرة في الأداء وقابلية توسع متفوقة من خلال تعيين مساحة الاتصال المتبقية في HC إلى مجمعات محددة لاستعادة خصائص تعيين الهوية، مع دمج تحسينات بنية تحتية صارمة لضمان الكفاءة. تتوقع DeepSeek أن mHC، كامتداد مرن وعملي ل HC، سيساعد في فهم تصميم البنية الطوبولوجية بشكل أفضل ويشير إلى اتجاه واعد لتطور النموذج الأساسي. شارك في تأليف الورقة تشيندا شيه، ييكشوان وي، وهوانتشي تساو كأول مؤلفين، كما أن ليانغ وينفينغ مدرج أيضا في قائمة المؤلفين.

شاهد النسخة الأصلية
قد تحتوي هذه الصفحة على محتوى من جهات خارجية، يتم تقديمه لأغراض إعلامية فقط (وليس كإقرارات/ضمانات)، ولا ينبغي اعتباره موافقة على آرائه من قبل Gate، ولا بمثابة نصيحة مالية أو مهنية. انظر إلى إخلاء المسؤولية للحصول على التفاصيل.
  • أعجبني
  • تعليق
  • إعادة النشر
  • مشاركة
تعليق
0/400
لا توجد تعليقات
  • Gate Fun الساخن

    عرض المزيد
  • القيمة السوقية:$3.55Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.55Kعدد الحائزين:1
    0.00%
  • القيمة السوقية:$3.61Kعدد الحائزين:2
    0.00%
  • القيمة السوقية:$3.66Kعدد الحائزين:3
    0.44%
  • القيمة السوقية:$3.55Kعدد الحائزين:1
    0.00%
  • تثبيت