De acordo com anúncios oficiais, a DeepSeek tornou permanente, em 22 de maio, o desconto de 75% da API V4-Pro, com os preços de saída travados em US$ 0,87 por milhão de tokens. A Xiaomi seguiu em 26 de maio ao cortar em até 99% os custos de entrada em cache do MiMo-V2.5, levando o modelo Pro a US$ 0,0036 por milhão de tokens para acertos em cache — mais barato por token do que a maioria das tarifas de caracteres de SMS.
Enquanto isso, laboratórios americanos seguiram na direção oposta. A OpenAI dobrou o preço de saída do GPT-5.5 para US$ 30 por milhão de tokens no lançamento, enquanto a Anthropic's Claude Opus 4.7 chegou com um novo tokenizador que pode inflar os custos reais em até 35%, apesar de cartões de tarifas inalterados. A diferença de preços entre o DeepSeek V4-Pro e o GPT-5.5 Pro, ambos com ~80% de pontuação em benchmarks de codificação SWE-Verified, está em 34x nos tokens de saída. Modelos de fronteira chineses agora custam 15–30x menos do que os equivalentes americanos para desempenho comparável.