✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
Hugging Face轉推turboquant-gpu工具,宣稱提供5.02倍KV快取壓縮
ME News 消息,4 月 6 日(UTC+8),Hugging Face近日轉推了anirudhbv_ce發布的消息,宣布推出turboquant-gpu工具。該工具宣稱能為任意GPU(包括RTX、H100、A100、B200)提供高達5.02倍的KV緩存壓縮。據文中介紹,其特點包括:與Hugging Face Transformers庫兼容;提供極簡API,宣稱只需3行代碼即可實現壓縮與生成;採用3-bit Lloyd-Max融合KV壓縮技術,並宣稱達到0.98的餘弦相似度。文中觀點認為,其性能表現優於MXFP4(3.76倍壓縮)和另一個未命名的方案。(來源:InFoQ)