Voir l'original
CryptoSelf
#GateSquareDaily #Deepseek #AIPriceWar #AIAgents
La guerre des prix de l'IA s'intensifie
DeepSeek’s V4 baisse les prix du marchĂ©, et les effets d'entraĂźnement se font dĂ©jĂ  sentir
Un nouveau front vient de s'ouvrir dans la course Ă  l'IA, et il ne concerne pas les benchmarks. Il s'agit du prix.
Le 24 avril 2026, DeepSeek, basĂ© Ă  Hangzhou, a publiĂ© des versions de prĂ©visualisation de sa famille de modĂšles V4 : V4-Pro et V4-Flash. Les deux sont Ă  poids ouvert, sous licence MIT, et supportent une fenĂȘtre de contexte de 1 million de tokens. La grande nouvelle, cependant, est le coĂ»t.
1. À quel point la rĂ©duction est-elle agressive ?
La tarification de l'API de DeepSeek redéfinit le seuil pour les modÚles de classe frontier :
‱ V4-Flash : 0,14 $ par million de tokens d'entrĂ©e, 0,28 $ par million de tokens de sortie ‱ V4-Pro : 1,74 $ par million de tokens d'entrĂ©e, 3,48 $ par million de tokens de sortie
Comparez cela aux leaders actuels aux États-Unis : GPT-5.5 est tarifĂ© Ă  $5 d'entrĂ©e / $30 de sortie par million de tokens, tandis que Claude Opus 4.6 fonctionne Ă  $25 par million de tokens de sortie. Gemini 3.1 Pro se situe Ă  $2 d'entrĂ©e / $12 de sortie.
En termes simples : V4-Pro coĂ»te environ un septiĂšme de Claude Opus 4.6 et presque un neuviĂšme de GPT-5.5 en tokens de sortie. V4-Flash est 12,4 fois moins cher que Pro tout en Ă©tant seulement 1,6 point en dessous sur SWE-bench Verified. Pour les dĂ©veloppeurs, c’est la diffĂ©rence entre un budget IA de 4 mois qui dure 7 ans Ă  niveau d’utilisation identique.
L'entreprise a déclaré que V4-Pro « égalise plusieurs modÚles leaders » et améliore les capacités des agents pour les tùches multi-étapes. Des tests indépendants placent V4-Pro à 80,6 % sur SWE-bench Verified, à 0,2 point prÚs de Claude Opus 4.6. Il domine sur LiveCodeBench avec 93,5 %.
2. Pourquoi cela importe : trois points de pression
L’adoption pourrait s’accĂ©lĂ©rer
À 0,28 $ par million de tokens de sortie, V4-Flash rend possibles des cas d’utilisation Ă  volume Ă©levĂ© : traitement de documents, analyse de bases de code, boucles d’agents. Les startups qui Ă©taient exclues du raisonnement de classe GPT-5 peuvent dĂ©sormais exĂ©cuter des charges de travail en production pour 1/10e du coĂ»t. La fenĂȘtre de contexte de 1 million de tokens signifie que des rĂ©fĂ©rentiels de code entiers ou des dĂ©pĂŽts juridiques tiennent dans une seule requĂȘte.
Les rivaux subissent une compression de marge
Les laboratoires occidentaux augmentent dĂ©jĂ  leurs prix et limitent l’utilisation pour gĂ©rer la demande. La dĂ©marche de DeepSeek impose un choix : rĂ©duire les prix et comprimer les marges, ou cĂ©der la part de marchĂ© des dĂ©veloppeurs. L’écart de prix n’est pas de 10 % ou 20 % — il est de 7 Ă  9 fois sur la sortie. Pour les entreprises construisant des flux de travail agentiques, le coĂ»t par token devient une ligne budgĂ©taire, et non une erreur d’arrondi.
Les rĂ©cits sur l’IA gagnent en carburant, y compris dans l’IA crypto
Une infĂ©rence bon marchĂ© modifie l’économie des agents IA. Si vous pouvez faire fonctionner un modĂšle de 1,6 T de paramĂštres pour 3,48 $ par million de tokens de sortie, les agents en chaĂźne, les rĂ©seaux d’infĂ©rence dĂ©centralisĂ©s et les projets de tokens IA ont soudainement une voie vers des coĂ»ts unitaires durables. V4 est sous licence MIT et Ă  poids ouvert, ce qui signifie que quiconque possĂšde des GPU peut l’auto-hĂ©berger. Cela Ă©limine la dĂ©pendance Ă  un fournisseur et s’aligne avec la thĂšse de la composabilitĂ© dans la crypto.
Le matĂ©riel fait aussi partie de l’histoire. Huawei a annoncĂ© le support complet de V4 sur ses puces Ascend 950 le mĂȘme jour. DeepSeek a validĂ© le modĂšle sur des GPU Nvidia et des NPU Huawei Ascend. La sociĂ©tĂ© a indiquĂ© que les prix Pro pourraient chuter fortement une fois que les supernƓuds Ascend 950 seront dĂ©ployĂ©s Ă  grande Ă©chelle dans la seconde moitiĂ© de 2026. Une pile IA domestique chinoise — modĂšles plus puces — rĂ©duit encore les coĂ»ts et diminue la dĂ©pendance au matĂ©riel amĂ©ricain.
3. Les compromis
V4-Pro n’est pas le meilleur dans tous les domaines. Sur SWE-bench Pro, qui mesure l’ingĂ©nierie logicielle en conditions rĂ©elles, Opus 4.7 domine Ă  64,3 % contre 55,4 % pour V4-Pro. Sur les tĂąches de raisonnement approfondi, GPT-5.5 conserve un avantage. DeepSeek reconnaĂźt que « les contraintes en capacitĂ© de calcul haut de gamme » limitent le dĂ©bit de Pro au lancement.
Et il y a le contexte rĂ©glementaire : le dĂ©partement d’État amĂ©ricain a averti mondialement Ă  propos de la distillation prĂ©sumĂ©e de modĂšles IA amĂ©ricains par la Chine, un jour avant le lancement de V4. OpenAI et Anthropic ont accusĂ© DeepSeek de distiller leurs modĂšles. DeepSeek n’a pas rĂ©pondu Ă  ces accusations.
4. Ce qui se passe ensuite
1. Pilotes d’entreprise : Attendez-vous Ă  ce que les CFO recalculent les modĂšles de ROI. Si V4-Pro offre 95 % de la capacitĂ© pour 10 % du coĂ»t, « suffisant » devient la norme pour de nombreuses tĂąches. 2. Dynamique open source : Avec 1,6 T de paramĂštres, une licence MIT et des poids Hugging Face, V4 devient le plus grand modĂšle open disponible. La fine-tuning et les dĂ©ploiements privĂ©s deviennent plus faciles. 3. Diversification matĂ©rielle : Le support complet d’Ascend indique que la pile IA chinoise mĂ»rit. Si Huawei livre en volume, les dĂ©veloppeurs chinois pourront construire sans Nvidia. 4. RĂ©action tarifaire : Surveillez OpenAI, Anthropic et Google. Maintenir le prix alors qu’un modĂšle ouvert atteint 80,6 % sur SWE-bench Ă  1/9e du coĂ»t n’est pas un Ă©quilibre stable.
Il s’agit d’une guerre des prix, mais aussi d’un changement de stratĂ©gie. DeepSeek V4 ne prĂ©tend pas battre GPT-5.5 ou Claude Opus 4.7 sur tous les benchmarks. Elle prĂ©tend ĂȘtre suffisamment proche, ouverte, et radicalement moins chĂšre. Pendant deux ans, l’hypothĂšse Ă©tait que les modĂšles frontier nĂ©cessitent des budgets de frontier. V4 brise ce lien.
Si l’adoption suit le prix, alors la demande en infĂ©rence, l’utilisation des agents, et les applications IA intĂ©grĂ©es — y compris les tokens IA crypto — s’étendront. Les concurrents devront rĂ©pondre sur le coĂ»t, pas seulement sur la capacitĂ©. Et le rĂ©cit selon lequel l’IA avancĂ©e doit fonctionner sur des puces amĂ©ricaines vient de recevoir un contre-exemple.
La guerre de l’IA ne concerne plus seulement qui a le modùle le plus intelligent. Il s’agit de qui rend l’intelligence abordable.
Cette page peut inclure du contenu de tiers fourni Ă  des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validitĂ© de ces contenus, n’endosse pas les opinions exprimĂ©es, et ne fournit aucun conseil financier ou professionnel Ă  travers ces informations. Voir la section Avertissement pour plus de dĂ©tails.
  • RĂ©compense
  • 3
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
ShainingMoon
· 04-28 05:03
Vers la Lune 🌕
Voir l'originalRépondre0
ShainingMoon
· 04-28 05:03
Vers la Lune 🌕
Voir l'originalRépondre0
ShainingMoon
· 04-28 05:03
2026 GOGOGO 👊
Répondre0
  • Épingler