Google Gemini 3.1 Flash-Lite chính thức ra mắt: giá đầu vào rẻ hơn 75% so với Claude 4.5 Haiku, điểm GPQA đạt 86,9%

Theo Beating, Google Gemini 3.1 Flash-Lite đã chuyển từ giai đoạn preview sang khả dụng chung (GA) vào ngày 8/5, trở thành mẫu rẻ nhất và nhanh nhất trong dòng Gemini 3. Giá nhập được đặt ở mức 0,25 USD cho mỗi 1 triệu token và giá xuất ở mức 1,50 USD cho mỗi 1 triệu token—chi phí nhập thấp hơn 75% so với Claude 4.5 Haiku (1,00 USD) và chi phí xuất thấp hơn 70% (5,00 USD). Mô hình có cửa sổ ngữ cảnh 1 triệu token và đạt thông lượng 363 token mỗi giây, nhanh hơn 45% so với Gemini 2.5 Flash.

Các bài benchmark hiệu năng cho thấy GPQA Diamond (lập luận khoa học ở trình độ sau đại học) đạt 86,9%, vượt Claude 4.5 Haiku (73,0%) và GPT-5 mini (82,3%). MMMU-Pro (lập luận đa phương thức) đạt 76,8%. Nhóm người dùng sớm gồm nền tảng dịch vụ khách hàng Gladly, cho biết giảm 60% chi phí và tỷ lệ thành công 99,6% trên các tác vụ chạy thực tế, cùng JetBrains, tích hợp Flash-Lite vào các công cụ hỗ trợ trong IDE.

Tuyên bố miễn trừ trách nhiệm: Thông tin trên trang này có thể đến từ bên thứ ba và không đại diện cho quan điểm hoặc ý kiến của Gate. Nội dung hiển thị trên trang này chỉ mang tính chất tham khảo và không cấu thành bất kỳ lời khuyên tài chính, đầu tư hoặc pháp lý nào. Gate không đảm bảo tính chính xác hoặc đầy đủ của thông tin và sẽ không chịu trách nhiệm cho bất kỳ tổn thất nào phát sinh từ việc sử dụng thông tin này. Đầu tư vào tài sản ảo tiềm ẩn rủi ro cao và chịu biến động giá đáng kể. Bạn có thể mất toàn bộ vốn đầu tư. Vui lòng hiểu rõ các rủi ro liên quan và đưa ra quyết định thận trọng dựa trên tình hình tài chính và khả năng chấp nhận rủi ro của riêng bạn. Để biết thêm chi tiết, vui lòng tham khảo Tuyên bố miễn trừ trách nhiệm.

Bài viết liên quan

CoreWeave Vượt Ước Tính Doanh Thu Q1 Với 2,08 tỷ USD, Cổ Phiếu Tăng 3%

Theo Reuters, CoreWeave công bố doanh thu quý 1 đạt 2,08 tỷ USD vào ngày 7/5, vượt ước tính trung bình của các nhà phân tích là 1,97 tỷ USD. Nhu cầu mạnh đối với điện toán hiệu năng cao dùng để huấn luyện và vận hành các mô hình AI đã thúc đẩy đà tăng trưởng của công ty cung cấp dịch vụ đám mây. Cổ phiếu của hãng tăng 3% trong phiên giao dịch mở rộng

GateNews2phút trước

OpenAI Chuyển Mô Hình Mặc Định của ChatGPT sang GPT-5.5 Instant, Giảm Ảo Giác tới 52,5%

Theo OpenAI, công ty đã chuyển mô hình mặc định của ChatGPT sang GPT-5.5 Instant vào ngày 8/5. Trong các bài thử nghiệm nội bộ, mô hình tạo ra ít hơn 52,5% các tuyên bố bịa đặt so với GPT-5.3 Instant trong các prompt mang tính rủi ro cao, đồng thời giảm 37,3% các tuyên bố không chính xác trong các cuộc hội thoại được người dùng gắn cờ vì lỗi thực factual er

GateNews12phút trước

Giám đốc điều hành Nvidia, Huang: Hạ tầng AI thế hệ tiếp theo cần nhiều kết nối quang, đồng không đủ vào ngày 8/5

Theo BlockBeats, vào ngày 8 tháng 5, CEO Nvidia Jensen Huang cho biết cơ sở hạ tầng AI thế hệ tiếp theo sẽ cần các kết nối quang rộng rãi vì đồng không đáp ứng được nhu cầu tính toán đang tăng nhanh. Huang khen ngợi quan hệ đối tác mới của Nvidia với Corning, gọi đây là một cơ hội quan trọng

GateNews16phút trước

Cloudflare cho nghỉ việc hơn 1.100 nhân viên (chiếm 20% lực lượng lao động) để chuyển sang vận hành dựa trên AI

Theo Reuters, Cloudflare đã cắt giảm hơn 1.100 nhân viên, tương đương khoảng 20% lực lượng lao động, vào ngày 8 tháng 5 để tái cơ cấu hoạt động xung quanh các công cụ AI. CEO Matthew Prince cho biết công ty đang thiết kế lại mọi nhóm và chức năng để thích ứng với kỷ nguyên AI tác nhân, đồng thời ghi nhận việc sử dụng AI nội bộ.

GateNews30phút trước

Google ra mắt Fitbit Air với giá 99,99 USD, bộ theo dõi không màn hình sẽ trở thành trung tâm Gemini Health Coach vào ngày 26 tháng 5

Theo Beating, Google đã ra mắt Fitbit Air, một thiết bị theo dõi sức khỏe không màn hình được định giá 99,99 USD, dự kiến giao hàng vào ngày 26 tháng 5. Thiết bị chỉ nặng 5,2 gram và có pin 7 ngày, cùng khả năng sạc nhanh trong 5 phút. Các cảm biến theo dõi nhịp tim 24 giờ, phát hiện rung nhĩ, oxy trong máu, h

GateNews32phút trước

OpenAI Phát Hành Ba Mô Hình Giọng Nói trong API Realtime; GPT-Realtime-2 có Cửa Sổ Ngữ Cảnh 128K

Theo Beating, OpenAI đã phát hành ba mô hình giọng nói trong Realtime API của mình: GPT-Realtime-2 cho hội thoại bằng giọng nói có suy luận, GPT-Realtime-Translate cho dịch thuật thời gian thực và GPT-Realtime-Whisper để ghi âm trực tuyến. GPT-Realtime-2 là mô hình giọng nói đầu tiên của OpenAI với mức độ tương đương GPT-5-level re

GateNews48phút trước
Bình luận
0/400
Không có bình luận