Theo Beating, sau khi phát hành 25 mô hình mã nguồn mở, bao gồm Nvidia Nemotron 3 Ultra và Google Gemma 4 12B, khoảng cách năng lực giữa các mô hình biên mã nguồn mở và mã nguồn đóng đang nhanh chóng thu hẹp, nhưng giá vẫn bị lệch đáng kể. Nhà đầu tư công nghệ Chamath Palihapitiya cho biết với các doanh nghiệp tiêu thụ 1 tỷ token đầu vào và 1 tỷ token đầu ra mỗi tháng, GPT-5.5 Pro có giá 105.000 USD, Claude Opus 4.8 là 30.000 USD, trong khi DeepSeek R1 chỉ 2.740 USD—khiến GPT-5.5 Pro có mức phí cao gấp 40 lần.
Chamath cảnh báo rằng đa số CEO công ty không biết nhóm kỹ thuật của họ đang mặc định dùng các API mô hình ngôn ngữ lớn đắt đỏ nhất mà không có cơ chế quản trị hoặc kiểm toán, dẫn đến vượt ngân sách. Ông dự đoán rằng khi các lớp điều phối định tuyến mô hình (model-routing) được áp dụng rộng rãi, doanh nghiệp sẽ chuyển sang kiến trúc không phụ thuộc vào mô hình, mặc định dùng các nhà cung cấp suy luận tối ưu về chi phí và chỉ dành các API cao cấp cho những ca sử dụng giá trị cao.