根據 Beating,在發布包含 Nvidia Nemotron 3 Ultra 與 Google Gemma 4 12B 在內的 25 個開源模型之後,開源與閉源前沿模型之間的能力差距正在迅速縮小,但定價仍然嚴重不匹配。科技投資人 Chamath Palihapitiya 指出,對於每月消耗 10 億輸入 token 與 10 億輸出 token 的企業而言,GPT-5.5 Pro 成本為 105,000 美元,Claude Opus 4.8 成本為 30,000 美元,而 DeepSeek R1 只要 2,740 美元——使得 GPT-5.5 Pro 溢價達 40 倍。
Chamath 警告稱,多數公司的執行長並不清楚,自己的工程團隊預設就會呼叫最昂貴的大型語言模型 API,而缺乏治理或稽核,因而導致預算超支。他預測,隨著模型路由控制平面(control planes)的採用增加,企業將採用與模型無關的架構(model-agnostic architectures),預設改用具成本效益的推論供應商,並僅在高價值使用情境中保留高階 API。