TencentのHunyuanがStem Sparse Attentionアルゴリズムを公開し、128Kのコンテキストで最初のトークン遅延を3.7倍短縮

Guru Clubによると、6月5日に腾讯のHunyuanが、トップレベルの機械学習カンファレンスICML-26で採択されたステム疎注意アルゴリズムを公開した。このアルゴリズムは、Token Position Decay(TPD)とOutput-Aware Metric(OAM)によって、予算25%でほぼ損失なしの精度を実現し、HPC演算子と組み合わせることで、128Kのコンテキスト長時に最初のトークンのレイテンシーを3.7倍低減する。
免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし