Google Giảm Dung Lượng Bộ Nhớ AI Mà Không Mất Độ Chính Xác—Nhưng Có Một Rủi Ro
Tóm tắt:
Google cho biết thuật toán TurboQuant của công ty có thể giảm một nút thắt bộ nhớ lớn trong AI xuống ít nhất 6 lần mà không mất độ chính xác trong quá trình suy luận.
Các cổ phiếu bộ nhớ bao gồm Micron, Western Digital và Seagate đã giảm sau khi bài báo được phổ biến.
Phương pháp này nén bộ nhớ suy luận, không phải mô hình.
Decrypt·03-25 23:30