فتحت Nous Research مصدرًا مفتوحًا لنموذج الانتباه Lighthouse مع تسريع 17x على B200 لسياق 512K

2026-05-16 15:14:17

تذكر شركة Beating أن Nous Research قد أطلقت كود Lighthouse Attention مفتوح المصدر، وهو آلية تدريب لسياقات طويلة تحقق تسريعاً 17x لمعالجة نص بطول 512 ألف على وحدة معالجة رسومية واحدة من طراز B200، وتسريعاً شاملاً للتدريب بنسبة 1.4–1.7x عند طول 98 ألف. تستخدم التقنية نهجاً من الخشن إلى الدقيق: إذ تقوم أولاً بمسح ملخصات مضغوطة بمستويات مختلفة لتحديد المقاطع الأساسية، ثم تمرّر النص المُفلتر إلى FlashAttention للمعالجة. وفي الاختبارات على نموذج تبلغ معلماته 5.3 مليار ومع تدريب على 50 مليار رمز، لم تُقلّل هذه المقاربة وقت التدريب فحسب، بل تطابقت أيضاً أو تجاوزت أداء خط الأساس للتدريب المعتمد بالكامل على الانتباه.

عرض المصدر

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.

أخبار ذات صلة

05-16 13:14

أوبن إيه آي تصلح عيبين خلف تدهور أداء GPT-5.5 Codex، وتعيد ضبط حدود استخدام المستخدمين

05-16 09:40

إيلون ماسك يزعم أن «Grok V9» (1.5 تريليون معلمة) يُظهر قفزة أداء هائلة على «V8» في 16 مايو

05-15 15:01

أكملت «جروك» التابعة لإيلون ماسك الإصدار V9 التدريب بأحجام بلغت 1.5 تريليون معامل، وتُظهر قفزة كبيرة في الأداء مقارنةً بالإصدار V8

05-15 07:00

تضاعف البحث عن شريحة Nvidia H200 25 مرة على JD.com منذ 14 مايو

05-15 06:45

كلاود أوبوس يكسر سجل nanoGPT عبر 2930 خطوة، مع استهلاك 14,000 ساعة من وحدات GPU من طراز H200

تحليل متعمق