Nous Research відкриває код Lighthouse Attention з прискоренням у 17 разів на B200 для контексту 512K

2026-05-16 15:14:17

Згідно з Beating, Nous Research оприлюднила Lighthouse Attention із відкритим кодом — механізм тренування для довгого контексту, який забезпечує 17-кратне прискорення обробки тексту довжиною 512 тис. на одному GPU B200, а також 1,4–1,7-кратне прискорення тренування «кінець-у-кінець» для довжини 98 тис. Техніка використовує підхід coarse-to-fine: спочатку вона сканує стиснені підсумки на різних рівнях, щоб визначити ключові сегменти, а потім передає відфільтрований текст у FlashAttention для обробки. У тестах на моделі з 5,3 мільярда параметрів, натренованій на 50 мільярдів токенів, підхід не лише скоротив час тренування, а й досягав або перевищував базову продуктивність тренування з повною увагою.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-16 13:14

OpenAI виправляє два баги, що спричиняли деградацію GPT-5.5 Codex, і скидає ліміти використання для користувачів

05-16 09:40

Елон Маск стверджує, що Grok V9 (1,5 трильйона параметрів) демонструє різкий стрибок продуктивності порівняно з V8 16 травня

05-15 15:01

Grok V9 від Елона Маска завершив тренування з 1,5 трильйона параметрів і показав суттєвий стрибок продуктивності порівняно з V8

05-15 07:00

Попит на чіпи Nvidia H200 на JD.com зріс у 25 разів з 14 травня

05-15 06:45

Claude Opus встановлює рекорд nanoGPT, виконавши 2 930 кроків і витративши 14 000 годин роботи GPU H200

Поглиблений аналіз