De acordo com Beating, após o lançamento de 25 modelos open-source, incluindo Nvidia Nemotron 3 Ultra e Google Gemma 4 12B, a lacuna de capacidade entre os modelos de fronteira open-source e closed-source está diminuindo rapidamente, mas os preços continuam drasticamente desalinhados. O investidor de tecnologia Chamath Palihapitiya destacou que, para empresas que consomem 1 bilhão de tokens de entrada e 1 bilhão de tokens de saída por mês, o GPT-5.5 Pro custa US$ 105 mil, o Claude Opus 4.8 custa US$ 30 mil, enquanto o DeepSeek R1 custa apenas US$ 2.740 — fazendo com que o GPT-5.5 Pro tenha um prêmio de 40x.
Chamath alertou que a maioria dos CEOs das empresas não sabe que suas equipes de engenharia estão, por padrão, usando as APIs de modelos de linguagem grandes mais caras, sem governança ou auditorias, o que leva a estouros de orçamento. Ele previu que, à medida que os planos de controle de roteamento de modelos ganharem adoção, as empresas adotarão arquiteturas agnósticas de modelos, recorrendo a provedores de inferência mais custo-efetivos e reservando APIs premium apenas para casos de alto valor.