أكملت شركة Huawei وحدة Ascend 910C مرحلة ما بعد التدريب لنموذج DeepSeek ذي 1.6 تريليون معلمة باستخدام أكثر من 1,000 وحدة معالجة رسومية (GPU)

أعلنت شركة Beating، وهي فريق مشترك من Shenzhen Hetao College، وجامعة هاربين للتكنولوجيا (شنتشن)، ومعهد شنتشن للأبحاث في البيانات الضخمة، وشركة Huawei، وDeepcity AI، عن اكتمال ناجح لمرحلة ما بعد التدريب بكامل المعلمات (full-parameter post-training) لنموذج DeepSeek-V4-Pro، وهو نموذج بعدد معلمات يصل إلى 1.6 تريليون، على بنية تحتية محلية للذكاء الاصطناعي. ويُعد هذا أول مرة ينجز فيها طرف خارجي مرحلة ما بعد التدريب بكامل المعلمات لنموذج بهذا الحجم على عتاد صيني.

استخدم الفريق عنقودًا يضم أكثر من 1,000 شريحة Huawei Ascend 910C للتغلب على اختناقات الاتصال عبر موازنة أحمال موزعة مُحسّنة. وخلال عملية التدريب المكوّنة من 1,500 خطوة، عمل النظام دون انقطاع، محققًا معدل استغلال FLOPs للنموذج (MFU) يتجاوز 30%، مع تحسين كفاءة المشغلين الرئيسيين بنسبة 14%، بما يحقق معايير الأداء على مستوى صناعي.

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات