Sakana AI та Nvidia досягають на 30% швидшого виведення на H100, пропускаючи 80% некоректних обчислень

GateNews

2026-05-10 04:45:31

Sakana AI та Nvidia оприлюднили з відкритим кодом TwELL — розріджений формат даних, який дає змогу GPU H100 пропускати 80% невалідних обчислень у великих мовних моделях без втрати точності. Рішення забезпечує до 30% швидшого виведення та на 24% швидшого навчання на H100, водночас зменшуючи пікове споживання пам’яті. Під час тестування на моделі з 1,5 мільярда параметрів підхід знизив активні нейрони до менш ніж 2% завдяки легкій регуляризації під час навчання, не спричинивши погіршення продуктивності на семи подальших завданнях.

Переглянути джерело

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.

Пов’язані новини

05-10 04:13

Microsoft відкриває вихідний код моделі Phi-Ground 4B, перевершує OpenAI Operator і Claude за точністю кліків по екрані

05-10 03:53

Tilde Research виявляє, що Muon Optimizer знищує 25% нейронів; альтернативний Aurora досягає приросту ефективності збирання даних у 100 разів

05-09 09:54

Система винагород OpenAI ненавмисно оцінює ланцюги міркувань на 6 моделях, зокрема GPT-5.4

05-09 07:41

MiniMax сканує 200 тис. токенів і виявляє 4,9% деградації в моделях серії M2

05-09 05:53

China Mobile запускає платформу моделей ШІ з 300+ інтеграціями, знижує витрати на токени на 30%

Поглиблений аналіз