Nvidia a dévoilé Nemotron 3 Ultra le 1er juin à Computex à Taipei, un modèle IA open-weight de 550 milliards de paramètres qui constitue la plus grande sortie IA ouverte de la société à ce jour. Le PDG Jensen Huang a annoncé le modèle lors de son discours d’ouverture, le présentant comme le modèle open-weight américain le mieux classé sur des benchmarks d’intelligence. Le lancement intensifie la concurrence dans le secteur de l’IA open-weight, où des modèles chinois, dont Kimi K2.6 de Moonshot AI, occupent actuellement les premières places mondiales en intelligence malgré les avantages de vitesse de Nvidia.
Artificial Analysis, qui s’est associé à Nvidia pour l’évaluation préalable à la sortie, a placé Nemotron 3 Ultra à 48 sur son Intelligence Index. Le benchmark composite agrège 10 évaluations couvrant le raisonnement, la programmation, la connaissance générale et les performances agentiques. Le score fait de Nemotron 3 Ultra le premier modèle open-weight américain, devant Gemma 4 31B de Google (39), Nemotron 3 Super de Nvidia (36) et gpt-oss-120b d’OpenAI (33).
Le modèle utilise une architecture de type mixture-of-experts avec 550 milliards de paramètres au total, mais n’en active que 55 milliards à tout moment. Cette conception réduit les coûts opérationnels tout en conservant des performances sur des tâches de raisonnement complexes.
Nemotron 3 Ultra a fourni plus de 300 tokens de sortie par seconde sur un endpoint DeepInfra en pré-sortie, selon les tests d’Artificial Analysis. Les modèles chinois de la même catégorie d’intelligence — DeepSeek V4 Pro et Kimi K2.6 — fonctionnent actuellement à 50–100 tokens par seconde via leurs API commerciales. Nvidia affirme que le modèle tourne cinq fois plus vite que des alternatives open-weight comparables, avec des coûts inférieurs de 30%.
L’architecture combine des couches Mamba-2, une attention Transformer standard et un routage mixture-of-experts. Le modèle prend en charge une fenêtre de contexte d’1 million de tokens et intègre la prédiction multi-token (MTP), qui génère simultanément plusieurs tokens futurs plutôt que séquentiellement.
Kimi K2.6 de Moonshot AI occupe la première place parmi les modèles open-weight avec un score d’Intelligence Index de 54, soit six points de plus que Nemotron 3 Ultra. Lancé en avril, Kimi K2.6 se classe quatrième au niveau mondial parmi tous les modèles IA, à trois points derrière les fleurons propriétaires d’Anthropic, Google et OpenAI, qui sont à égalité à 57.
Les modèles open-source chinois ont augmenté leur part d’utilisation mondiale des open-modèles d’environ 1,2% fin 2024 à environ 30% d’ici fin 2025, comme rapporté en mars.
Nvidia a publié son premier modèle de marque Nemotron en novembre 2023, la troisième génération ayant été annoncée en décembre 2025. La famille comprend trois tailles : Nano pour les tâches légères, Super pour les applications d’entreprise de milieu de gamme, et Ultra pour les charges de travail de raisonnement complexes. Les trois modèles partagent la même architecture hybride combinant des couches Mamba-2, l’attention Transformer et un routage mixture-of-experts.
Nemotron 3 Super, publié en mars avec 120 milliards de paramètres, a obtenu 36 sur l’Intelligence Index. L’augmentation de 12 points de Nemotron 3 Ultra représente une avancée significative au sein de la gamme produit.
Nvidia a dévoilé un plan quinquennal visant à consacrer 26 milliards de dollars au développement d’une IA open-weight. La société a formé la Nemotron Coalition en mars, un groupe de huit laboratoires IA incluant Mistral AI et Perplexity, pour co-développer des modèles open frontier sur l’infrastructure DGX Cloud. Nvidia a annoncé qu’elle travaille sur Nemotron 4, la prochaine génération de la famille de modèles.
Nemotron 3 Ultra sort le 4 juin. Les poids du modèle sont publics et des recettes d’entraînement sont publiées. Les utilisateurs peuvent accéder au modèle via l’API de Nvidia ou via des fournisseurs cloud, sans nécessiter de matériel de datacenter dédié.
Quel score d’intelligence a obtenu Nemotron 3 Ultra de Nvidia le 1er juin ? Nemotron 3 Ultra a obtenu 48 sur l’Artificial Analysis Intelligence Index, ce qui en fait le modèle open-weight américain le mieux classé. Le benchmark agrège 10 évaluations couvrant le raisonnement, la programmation, la connaissance générale et les performances agentiques.
Quelle est la comparaison de la vitesse de Nemotron 3 Ultra avec les modèles chinois ? Nemotron 3 Ultra a délivré plus de 300 tokens de sortie par seconde sur un endpoint DeepInfra en pré-sortie, tandis que les modèles chinois DeepSeek V4 Pro et Kimi K2.6 fonctionnent à 50–100 tokens par seconde via leurs API commerciales.
Quand Nemotron 3 Ultra de Nvidia devient-il disponible ? Nemotron 3 Ultra sort le 4 juin. Les utilisateurs peuvent accéder au modèle via l’API de Nvidia ou via des fournisseurs cloud, avec des poids publics et des recettes d’entraînement publiées.
Actualités associées
Alphabet cherche à mobiliser 80 milliards de dollars pour financer l’expansion de son infrastructure d’IA
NVIDIA s’associe à Unitree pour un modèle de référence de robot humanoïde H2+
Intel vise Nvidia et AMD avec une nouvelle puce IA
NVIDIA lance la puce de PC RTX Spark et le CPU Vera à COMPUTEX 2026
OpenAI annonce le lancement de sa division de robotique le 1er juin