NVIDIA تعلن عن فتح مصدر هندسة TwoTower Architecture، محققة تسريعاً في توليد النصوص بنسبة 2.42x

وفقًا لـ Beating، قامت NVIDIA بفتح مصدر Nemotron-Labs-TwoTower، وهي بنية نشر نصي منفصلة مصممة لتسريع توليد النص في نماذج اللغة الكبيرة. يفصل التصميم ثنائي البرج نموذجًا ذاتي التراجع مجمدًا يحافظ على القدرة الاستدلالية عن برج إزالة الضوضاء قابل للتدريب يولد النص بالتوازي. باستخدام 1/12 فقط من بيانات التدريب الأساسي على نموذج Mamba-Transformer المختلط الخبراء بمعامل 30 مليار، احتفظ TwoTower بنسبة 98.7% من الجودة الأساسي مع زيادة سرعة التوليد بمقدار 2.42 مرة دون حمل إضافي للذاكرة.
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات