Theo CNBC, các nhà lãnh đạo AI bao gồm CEO Cognition Scott Wu và CPO Cisco Jeetu Patel cho biết trong tuần này rằng model routing—một giải pháp ghép các tác vụ với đúng mô hình AI phù hợp dựa trên mức độ phức tạp—đang trở thành một kỷ luật kiểm soát chi phí quan trọng tại Mỹ trong khu vực doanh nghiệp.
Hiện tại, khoảng 95% việc sử dụng AI trong doanh nghiệp mặc định dùng các mô hình “frontier” đắt đỏ ngay cả cho các tác vụ thường ngày, theo CEO Glean Arvind Jain. Model routing có thể mang lại hiệu quả chi phí tốt hơn 5 đến 10 lần cho các công việc mang tính khuôn mẫu bằng cách dùng các lựa chọn rẻ hơn. Phân tích chi phí của Cisco cho thấy áp lực rõ rệt: với mức sử dụng token 200 USD mỗi nhân viên mỗi tuần, công ty phải đối mặt với khoảng 900 triệu USD chi phí AI hằng năm cho 90.000 nhân viên. Nếu doanh nghiệp ngày càng chuyển các tác vụ có khối lượng lớn và dễ dàng sang các mô hình rẻ hơn hoặc mô hình mã nguồn mở, OpenAI và Anthropic chỉ nhận thanh toán cho phần việc phức tạp, qua đó có thể thay đổi đáng kể các mô hình định giá mà cả hai công ty đã xây dựng dựa trên các định giá đó.