NVIDIA publie la IA open source la plus puissante aux États-Unis, avec un indice d’intelligence de 48, derrière le modèle Kimi

2026-06-02 03:28:58

Le 1er juin, le PDG de Nvidia, Huang Renxun, a dévoilé Nemotron 3 Ultra lors de sa keynote au Computex à Taipei. Ce modèle de poids ouverts a obtenu un indice de sagesse de 48 dans le cadre d’une évaluation pré-ouverte menée par Artificial Analysis et Nvidia, mais il a été devancé par Kimi K2.6, de Moonshot AI en Chine, qui affiche 54.

Spécifications techniques de Nemotron 3 Ultra : 55 milliards de paramètres actifs, fenêtre de contexte d’un million de tokens et expédition le 4 juin

Nemotron 3 Ultra s’appuie sur une architecture à experts clairsemés (MoE) : 550 milliards de paramètres au total, mais seulement 55 milliards de paramètres actifs sont activés à un moment donné, combinant des couches Mamba-2, le mécanisme d’attention standard des Transformer et un routage par experts. Le modèle prend en charge une fenêtre de contexte de 1 million de tokens et utilise la technologie de prédiction multi-tokens (MTP) pour améliorer la vitesse de génération.

Nvidia indique que, par rapport aux modèles de poids ouverts comparables, l’Ultra est 5 fois plus rapide en inférence et affiche des coûts inférieurs de 30 %. Sur les endpoints en prépublication de DeepInfra, le modèle peut traiter plus de 300 tokens de sortie par seconde ; en comparaison, DeepSeek V4 Pro et Kimi K2.6 ne traitent que 50 à 100 tokens par seconde via des API commerciales. Les poids du modèle sont rendus publics, le plan d’entraînement a été publié et la date d’expédition officielle est fixée au 4 juin 2026.

Comparaison directe des indices de sagesse entre l’open source américain et chinois : données d’Artificial Analysis

D’après les données d’évaluation publiées par Artificial Analysis, le classement des principaux modèles par indice de sagesse est le suivant : les principaux modèles fermés mondiaux (Anthropic, Google, OpenAI) obtiennent tous 57 points ; Kimi K2.6 (Moonshot AI, Chine, publié en avril 2026) obtient 54 points, se classant quatrième dans le monde ; Nemotron 3 Ultra (Nvidia, États-Unis) obtient 48 points, premier open source aux États-Unis ; Google Gemma 4 31B (États-Unis) obtient 39 points ; Nemotron 3 Super (Nvidia, mars 2026, 120B de paramètres) obtient 36 points ; OpenAI gpt-oss-120b (États-Unis) obtient 33 points. L’indice de sagesse agrège un étalon de référence global basé sur 10 évaluations (inférence, codage, connaissances générales, performance des agents). Plus le score est élevé, plus le modèle est performant.

Alliance Nemotron et Nemotron 4 : cadre de développement de la prochaine génération déjà confirmé

En parallèle du Computex, Nvidia a annoncé que Nemotron 4 est en développement. Il sera piloté par l’alliance Nemotron, formée par Nvidia en mars 2026, et regroupera 8 laboratoires d’IA, dont Mistral AI et Perplexity, qui développeront en commun à partir des infrastructures cloud DGX.

Nvidia avait auparavant annoncé publiquement un plan d’investissement en IA open source sur cinq ans de 26 milliards de dollars. Nemotron 3 Ultra est à ce jour le résultat le plus représentatif. La part mondiale d’utilisation de l’open source des modèles chinois est passée d’environ 1,2 % fin 2024 à environ 30 % fin 2025 (source : Decrypt, rapport de mars 2026).

Questions fréquentes

Quelles améliorations Nemotron 3 Ultra apporte-t-il par rapport à l’ancienne génération de Nemotron 3 Super ?

Nemotron 3 Super a été publié en mars 2026, avec 120 milliards de paramètres et un indice de sagesse de 36 points ; l’indice de sagesse de Nemotron 3 Ultra atteint 48 points, soit une hausse de 12 points d’une année sur l’autre. Nvidia indique que cette progression de 12 points représente un bond significatif dans le domaine des tests de référence.

Pourquoi l’indice de sagesse de Kimi K2.6 est-il supérieur à celui de Nemotron 3 Ultra ?

Kimi K2.6 de Moonshot AI en Chine affiche un indice de sagesse de 54 points, soit 6 points de plus que les 48 points de Nemotron 3 Ultra. Dans le monde entier, tous les modèles (y compris les modèles fermés) se classent à la quatrième place, à seulement 3 points derrière les modèles fermés phares d’Anthropic, Google et OpenAI (chacun à 57 points). Les équipes américaines comme OpenAI, Anthropic et Google ont tendance à garder leurs modèles les plus puissants derrière les API, tandis que les laboratoires chinois continuent d’alimenter l’écosystème open source avec des modèles hautement performants.

Dans quels scénarios l’avantage de vitesse de Nemotron 3 Ultra est-il le plus décisif ?

L’Ultra traite plus de 300 tokens de sortie par seconde, soit environ 3 à 6 fois plus rapide que les API commerciales de DeepSeek V4 Pro et Kimi K2.6. Nvidia souligne que cet avantage est particulièrement important lorsque des agents d’IA autonomes exécutent des tâches longues en plusieurs étapes, car le temps d’attente à chaque étape s’accumule rapidement sur des tâches complexes.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

06-02 00:49

Le CPU Vera 88 cœurs de Nvidia sera utilisé par Anthropic, OpenAI et SpaceX ; production complète au troisième trimestre

06-02 00:01

MiniMax dévoile le modèle de codage M3 avec une capacité de 100 millions de jetons, 5 fois plus rapide en traitement le 1er juin

06-01 22:51

Nvidia dévoile Nemotron 3 Ultra, le meilleur modèle Open des États-Unis, mais se classe derrière Kimi K2.6 de Chine