✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
突發:Google 公布了 TurboQuant,一種旨在在不損失的情況下壓縮語言模型工作記憶的技術。
如果如研究所示達到商用,可能會緩解當前人工智慧的一個主要瓶頸:處理長篇上下文、代理和大量推理工作所需的記憶體成本與稀缺性。
TurboQuant 旨在將 KV 快取的使用量降低最多六倍,並將晶片上的處理速度提升最多八倍,且不會丟失資料。