Google Cloud giới thiệu mô hình Gemini 3.2 Flash Lite với chi phí suy luận thấp hơn 95% so với GPT-5.5

2026-05-17 02:37:23

Theo giám sát của Beating.AI, một tùy chọn mô hình mới có tên gemini-3.2-flash-lite-live-preview đã xuất hiện trong danh sách chọn mô hình của Google Cloud tính đến ngày 17/5. Các hậu tố “lite” và “live” cho thấy Google đang tạo một phiên bản chuyên biệt được tối ưu cho các tương tác thời gian thực có độ trễ cực thấp.

CEO Abacus.AI Bindu Reddy trước đó đã tiết lộ rằng Gemini 3.2 Flash đạt 92% năng lực lập trình và suy luận của GPT-5.5, đồng thời giữ chi phí suy luận chỉ bằng 1/20 so với GPT-5.5, với đa số truy vấn trả về phản hồi dưới 200 mili giây. Giới quan sát kỳ vọng mô hình nhẹ được tối ưu chi phí này sẽ được Google chính thức công bố tại sự kiện Google I/O vào ngày 20/5.

Xem nguồn

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ các nguồn bên thứ ba và chỉ mang tính chất tham khảo. Thông tin này không phản ánh quan điểm hoặc ý kiến của Gate và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Giao dịch tài sản ảo tiềm ẩn rủi ro cao. Vui lòng không chỉ dựa vào thông tin trên trang này khi đưa ra quyết định. Để biết thêm chi tiết, vui lòng xem Tuyên bố miễn trừ trách nhiệm.

Tin tức liên quan

05-17 01:29

Claude Mythos gỡ thẻ xem trước khỏi Google Cloud Console vào ngày 17/5

05-16 06:28

Grok-4.20 và GPT 5.4 Pro cùng dẫn đầu về điểm cao nhất trong bài kiểm tra IQ Mensa dành cho nam, với 145 điểm

05-14 10:49

Rò rỉ Google Gemini Spark 24-Hour Agent hôm nay; có thể thực hiện các giao dịch mua mà không cần xác nhận từ người dùng

05-14 06:25

Google sẽ ra mắt Gemini 3.2 Flash tại I/O vào ngày 20 tháng 5, đạt hiệu năng tương đương GPT-5.5 với chi phí chỉ bằng 1/15

05-12 20:41

Google Giới thiệu Gemini Intelligence cho Android, Ra mắt trên Galaxy S26 và Pixel 10 vào Mùa Hè này

Phân tích chuyên sâu