Google Phát hành mô hình Gemma 4 12B được thiết kế cho laptop có 16GB RAM

2026-06-04 00:21:23

Theo Beating, Google đã phát hành Gemma 4 12B, một kích thước mô hình mới trong họ Gemma 4 được thiết kế để chạy tác nhân AI đa phương thức cục bộ trên laptop phổ thông với 16GB RAM. Mô hình 12B tham số sử dụng kiến trúc đa phương thức không cần bộ mã hóa (encoder-free), hỗ trợ đầu vào dạng văn bản và hình ảnh, qua đó lấp đầy khoảng trống hiệu năng giữa các mô hình nhỏ hơn và lớn hơn trong dòng sản phẩm.

Đồng thời, Google cũng nâng cấp công cụ suy luận cục bộ LiteRT-LM của mình với khả năng tương thích API của OpenAI, cho phép nhà phát triển kết nối các công cụ như Continue, Aider và Open WebUI trực tiếp tới một phiên bản Gemma 4 12B chạy cục bộ mà không cần dựa vào các mô hình trên đám mây.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

06-04 00:06

Meta mở rộng AI Business Agent sang WhatsApp, Messenger và Instagram vào ngày 3 tháng 6

06-03 20:46

Giáo sư Luật thích câu trả lời do AI tạo hơn phản hồi từ đồng nghiệp trong nghiên cứu gần đây, tỷ lệ 75% ưa thích

06-03 19:36

Perplexity ra mắt suy luận lai tác nhân tại Computex 2026, chia tác vụ AI giữa thiết bị cục bộ và đám mây

06-03 15:05

Moonshot AI ra mắt nền tảng Work Kimi hỗ trợ tối đa 300 tác nhân cộng tác với nhau

06-03 14:30

Meta ra mắt tính năng tác nhân AI doanh nghiệp cho WhatsApp trên toàn cầu để tự động trả lời tin nhắn khách hàng

Phân tích chuyên sâu