Tin nhắn Gate News, ngày 22 tháng 4 — Google Cloud thông báo việc phát hành các chip TPU (Tensor Processing Unit) tùy chỉnh thế hệ thứ tám do họ tự phát triển vào ngày 22 tháng 4. Dòng sản phẩm mới bao gồm TPU 8t, được thiết kế riêng cho các tác vụ huấn luyện AI, và TPU 8i, được tối ưu cho các tác vụ suy luận AI. Cả hai chip sẽ có mặt vào cuối năm nay. Google cũng giới thiệu các công cụ mới để xây dựng tác nhân AI và công bố một quỹ $750 triệu nhằm thúc đẩy doanh nghiệp ứng dụng AI.
TPU 8t mang lại hiệu năng cao gấp 2,8 lần so với TPU Ironwood thế hệ trước của Google ở cùng mức giá. TPU 8i cải thiện hiệu năng thêm 80% so với thế hệ tiền nhiệm và tích hợp kiến trúc bộ nhớ truy cập ngẫu nhiên tĩnh (SRAM) để mang lại "thông lượng quy mô lớn và độ trễ thấp một cách tiết kiệm chi phí, cho phép hàng triệu tác nhân chạy đồng thời," theo CEO Sundar Pichai. So với Ironwood, cả TPU 8t và TPU 8i đều đạt hiệu suất trên mỗi watt cao hơn gấp đôi, với TPU 8t tăng 124% và TPU 8i tăng 117%. Google đã tối ưu hiệu suất sử dụng điện trên toàn bộ ngăn xếp công nghệ và tích hợp các hệ thống quản lý công suất động điều chỉnh mức tiêu thụ dựa trên nhu cầu theo thời gian thực.
Các mô hình do Google phát triển trực tiếp hiện xử lý hơn 160 tỷ token mỗi phút thông qua lệnh gọi API trực tiếp của khách hàng, tăng từ 100 tỷ ở quý trước. AI hiện tạo ra 75% tổng lượng mã code mới tại Google, so với 50% vào mùa thu năm ngoái. Gemini Enterprise, sản phẩm doanh nghiệp của Google, tăng 40% theo từng quý trong số người dùng hoạt động hằng tháng trả phí. Công ty dự kiến sẽ đầu tư hơn một nửa ngân sách điện toán máy học vào các dịch vụ đám mây vào năm 2026 để phục vụ tốt hơn khách hàng và đối tác đám mây. Google cũng đang mở rộng hợp tác với Broadcom để phát triển và cung cấp các chip TPU tùy chỉnh cho các thế hệ tương lai, khi các công ty công nghệ lớn tìm kiếm lựa chọn thay thế cho các GPU đắt đỏ và bị hạn chế nguồn cung từ NVIDIA và AMD.