As-tu compris cette stratégie très intéressante de NVIDIA ? Ils ont acquis l’activité de puces d’inférence de Groq pour 200 milliards de dollars, et cela commence maintenant à avoir beaucoup plus de sens pourquoi ils ont fait cela.



Ce qui a attiré mon attention, c’est l’explication de Huang Renxun sur la logique derrière cette acquisition. Fondamentalement, le marché de l’inférence se segmente. Avant, tout le monde se concentrait sur une seule chose : augmenter le débit. Mais alors, la valeur commerciale des tokens a beaucoup changé, et différents utilisateurs sont prêts à payer des prix différents en fonction de la vitesse de réponse.

C’est comme ça : si je peux fournir des réponses plus rapides aux ingénieurs, leur permettant de travailler plus efficacement, ils seront prêts à payer plus pour cela. Et cette demande pour une faible latence est relativement nouvelle sur le marché.

Puis intervient Groq. Leur architecture LPU est justement connue pour sa faible latence déterministe, ce qui complète parfaitement l’approche à haut débit des GPU de NVIDIA. Lorsqu’ils ont lancé le Groq 3 LPU en 4nm, ils ont montré que la capacité d’inférence par mégawatt dans des modèles de trillions de paramètres est 35 fois supérieure à celle du Blackwell NVL72. Ce n’est pas rien.

Autrement dit, NVIDIA a comblé une lacune importante dans sa gamme de produits. Maintenant, ils couvrent à la fois le segment à haut débit et celui à faible latence avec une haute valeur unitaire. Expansion Pareto, comme certains l’appellent. Même modèle, prix différents selon le temps de réponse. Débit moindre, mais le prix unitaire compense.

C’est la stratégie : ce n’est pas de la compétition, c’est de la complémentarité. Et cela a beaucoup de sens compte tenu de l’évolution du marché de l’IA.
Voir l'original
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler