Tencent Hunyuan представляє алгоритм Stem Sparse Attention, скорочує затримку до першого токена в 3,7 раза на контексті 128K

За даними Guru Club, 5 червня Tencent Hunyuan представила алгоритм Stem sparse attention, який прийняв провідний в галузі машинного навчання конференційний захід ICML-26. Алгоритм досягає майже безпотерь точності за бюджету 25% завдяки Token Position Decay (TPD) та Output-Aware Metric (OAM), знижуючи затримку першого токена на 3,7 раза за довжини контексту 128K, коли його поєднують із HPC-операторами.
Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів