Vừa mới nắm bắt được chiến lược giá API Gemini mới nhất của Google đến năm 2026, và thực sự khá thú vị từ góc độ nhà phát triển. Họ về cơ bản đang xây dựng một bậc thang giá phù hợp với các trường hợp sử dụng khác nhau thay vì ép buộc mọi người vào một khuôn khổ duy nhất.



Vì vậy, đây là những gì họ đã triển khai: năm cấp độ cơ bản. Cấp độ Priority là cái thu hút sự chú ý của tôi đầu tiên - có giá cao hơn từ 75 đến 100% so với mức giá tiêu chuẩn, nhưng bạn nhận được phản hồi trong vòng mili giây đến giây. Đó là cấp độ dành cho các công việc quan trọng, bot dịch vụ khách hàng không thể chậm trễ, hệ thống phát hiện gian lận cần tốc độ cao. Rất hợp lý.

Sau đó bạn có các cấp đối lập. Các cấp Flexible và Batch đều có giá bằng một nửa. Flexible dành cho các ứng dụng không quá quan tâm đến độ trễ, Batch xử lý các công việc xử lý dữ liệu lớn của bạn. Nếu bạn chạy các hoạt động hàng loạt hoặc các tác vụ không yêu cầu thời gian gấp rút, mức giảm giá 50% đó khá đáng kể.

Điều thú vị về cấu trúc giá API Gemini của Google là cấp Cache - nó được thiết kế cho các tình huống yêu cầu tần suất cao, các lệnh phức tạp. Bạn trả phí dựa trên số token và thời gian lưu trữ, đây là một mô hình khác so với các mô hình còn lại. Nó tối ưu cho các tình huống bạn liên tục truy cập API với các lệnh tương tự nhau.

Toàn bộ cảm giác như Google đang cố gắng giải quyết một vấn đề thực sự. Không phải ứng dụng nào cũng cần những thứ giống nhau, đúng không? Một số cần tốc độ, một số cần khối lượng lớn, một số cần tiết kiệm chi phí. Bằng cách cung cấp các cấp dịch vụ riêng biệt này, họ về cơ bản đang nói 'hãy chọn những gì phù hợp với trường hợp sử dụng của bạn' thay vì trả tiền cho các tính năng cao cấp mà bạn không cần.

Từ góc độ thị trường, loại giá linh hoạt cho dịch vụ API này đang trở thành tiêu chuẩn. Các nhà phát triển ngày càng thông minh hơn về chi phí hạ tầng, và các nền tảng cho phép tối ưu hóa theo nhu cầu thực tế của bạn thường chiếm ưu thế trong việc thu hút người dùng. Thật đáng để theo dõi cách điều này sẽ ảnh hưởng đến thị trường dịch vụ suy luận AI rộng lớn hơn.
Xem bản gốc
Trang này có thể chứa nội dung của bên thứ ba, được cung cấp chỉ nhằm mục đích thông tin (không phải là tuyên bố/bảo đảm) và không được coi là sự chứng thực cho quan điểm của Gate hoặc là lời khuyên về tài chính hoặc chuyên môn. Xem Tuyên bố từ chối trách nhiệm để biết chi tiết.
  • Phần thưởng
  • Bình luận
  • Đăng lại
  • Retweed
Bình luận
Thêm một bình luận
Thêm một bình luận
Không có bình luận
  • Ghim