D’après les annonces officielles, DeepSeek a rendu son rabais de 75% sur l’API V4-Pro permanent le 22 mai, avec des prix de sortie verrouillés à 0,87 $ par million de tokens. Xiaomi a suivi le 26 mai en réduisant jusqu’à 99% les coûts d’entrée en cache de MiMo-V2.5, faisant passer le modèle Pro à 0,0036 $ par million de tokens pour les cache hits — moins cher par token que la plupart des tarifs par caractère des SMS.
Pendant ce temps, des laboratoires américains ont fait le mouvement inverse. OpenAI a doublé le prix de sortie de GPT-5.5 à 30 $ par million de tokens lors du lancement, tandis qu’Anthropic a expédié Claude Opus 4.7 avec un nouveau tokenizer capable d’augmenter les coûts réels jusqu’à 35% malgré des tarifs inchangés. L’écart de prix entre DeepSeek V4-Pro et GPT-5.5 Pro, tous deux obtenant ~80% sur des benchmarks de codage SWE-Verified, se situe à 34x sur les tokens de sortie. Les modèles de pointe chinois se négocient désormais à un coût 15–30x inférieur à celui de leurs homologues américains pour des performances comparables.