Tencent Hunyuan представила алгоритм Stem Sparse Attention, сокращающий задержку до первого токена в 3,7 раза при контексте 128K

2026-06-05 14:19:03

По данным Guru Club, 5 июня Tencent Hunyuan представила алгоритм Stem sparse attention, принятый на ведущей конференции по машинному обучению ICML-26. Алгоритм обеспечивает почти без потерь точность при бюджете 25% благодаря Token Position Decay (TPD) и Output-Aware Metric (OAM), снижая задержку первого токена на 3,7 раза при длине контекста 128K при совместном использовании с HPC-операторами.

Посмотреть источник

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.

Связанные новости

06-05 04:01

AI-учёный Tencent называет ИИ долгосрочной игрой, поскольку начинается второй этап

06-05 03:31

Tencent запускает набор инструментов для AI-агента эффективности для 20+ сценариев 5 июня

06-05 03:01

Tencent открывает WeChat для AI-ассистентов от Honor, Huawei, Xiaomi, Oppo и Vivo

06-05 02:40

Tencent сгенерировала большую часть кода с помощью ИИ в этом году, заявляют руководители

06-05 01:58

Команда из Шэньчжэня завершила обучение модели DeepSeek-V4-Pro на 1,6 триллиона параметров на собственном чипе Ascend 910C, разработанном в Китае

Детальный анализ