Nvidia stellte am 1. Juni auf der Computex in Taipeh Nemotron 3 Ultra vor, ein Open-Weight-KI-Modell mit 550 Milliarden Parametern, das die bisher größte Open-KI-Veröffentlichung des Unternehmens darstellt. CEO Jensen Huang kündigte das Modell während seiner Keynote an und positionierte es als bestplatziertes Open-Weight-Modell der USA auf Intelligenz-Benchmarks. Die Veröffentlichung verschärft den Wettbewerb im Bereich der Open-Weight-KI, in dem chinesische Modelle einschließlich Kimi K2.6 von Moonshot AI derzeit die globalen Intelligenz-Rankings anführen – trotz Nvidias Geschwindigkeitsvorteilen.
Artificial Analysis, das für die Vorab-Evaluierung mit Nvidia zusammenarbeitete, setzte Nemotron 3 Ultra auf 48 im Intelligence Index. Der zusammengesetzte Benchmark bündelt 10 Bewertungen über Reasoning, Coding, Allgemeinwissen und agentische Performance. Die Punktzahl macht Nemotron 3 Ultra zum Top-Open-Weight-Modell aus den USA und liegt damit vor Googles Gemma 4 31B mit 39, Nvidias eigenem Nemotron 3 Super mit 36 sowie OpenAIs gpt-oss-120b mit 33.
Das Modell verwendet eine Mixture-of-Experts-Architektur mit insgesamt 550 Milliarden Parametern, aktiviert jedoch jeweils nur 55 Milliarden zu einem gegebenen Zeitpunkt. Dieses Design senkt die Betriebskosten, während die Performance bei komplexen Reasoning-Aufgaben erhalten bleibt.
Nemotron 3 Ultra lieferte laut Tests von Artificial Analysis auf einem Pre-Release-DeepInfra-Endpoint über 300 Output-Tokens pro Sekunde. Chinesische Modelle in derselben Intelligenzklasse – DeepSeek V4 Pro und Kimi K2.6 – arbeiten derzeit mit 50–100 Tokens pro Sekunde über ihre kommerziellen APIs. Nvidia behauptet, das Modell sei fünfmal schneller als vergleichbare Open-Weight-Alternativen und die Kosten lägen 30% niedriger.
Die Architektur kombiniert Mamba-2-Layer, standardmäßige Transformer-Attention und Mixture-of-Experts-Routing. Das Modell unterstützt ein 1-Million-Token-Context-Fenster und integriert Multi-Token-Prediction (MTP), die mehrere zukünftige Tokens gleichzeitig generiert – statt sequenziell.
Kimi K2.6 von Moonshot AI belegt die Spitzenposition unter den Open-Weight-Modellen mit einem Intelligence-Index-Score von 54, sechs Punkte vor Nemotron 3 Ultra. Das im April veröffentlichte Kimi K2.6 belegt global Platz vier unter allen KI-Modellen und liegt drei Punkte hinter den proprietären Flaggschiffen von Anthropic, Google und OpenAI, die sich bei 57 einordnen.
Chinesische Open-Source-Modelle erhöhten ihren Anteil an der globalen Nutzung von Open-Modellen von etwa 1,2% Ende 2024 auf rund 30% bis Ende 2025, wie im März berichtet wurde.
Nvidia brachte sein erstes Nemotron-Modell unter eigenem Branding im November 2023 heraus, die dritte Generation wurde im Dezember 2025 angekündigt. Die Familie umfasst drei Größen: Nano für leichte Aufgaben, Super für Enterprise-Anwendungen im mittleren Bereich und Ultra für komplexe Reasoning-Workloads. Alle drei Modelle nutzen dieselbe hybride Architektur aus Mamba-2-Layern, Transformer-Attention und Mixture-of-Experts-Routing.
Nemotron 3 Super, das im März mit 120 Milliarden Parametern veröffentlicht wurde, erzielte 36 im Intelligence Index. Der 12-Punkte-Anstieg von Nemotron 3 Ultra stellt einen bedeutenden Fortschritt innerhalb der Produktlinie dar.
Nvidia gab einen Fünfjahresplan bekannt, um 26 Milliarden US-Dollar in die Entwicklung von Open-Weight-KI zu investieren. Das Unternehmen bildete im März die Nemotron Coalition – eine Gruppe aus acht KI-Labs, darunter Mistral AI und Perplexity – um gemeinsam Open-Frontier-Modelle auf der DGX-Cloud-Infrastruktur zu entwickeln. Nvidia kündigte an, dass man an Nemotron 4 arbeitet, der nächsten Generation in der Modellfamilie.
Nemotron 3 Ultra erscheint am 4. Juni. Die Modellgewichte sind öffentlich und Trainingsrezepte werden veröffentlicht. Nutzer können auf das Modell über Nvidias API oder Cloud-Provider zugreifen, ohne dedizierte Rechenzentrums-Hardware zu benötigen.
Welchen Intelligence-Score hat Nvidias Nemotron 3 Ultra am 1. Juni erreicht? Nemotron 3 Ultra erzielte 48 im Artificial-Analysis-Intelligence-Index und ist damit das bestplatzierte Open-Weight-Modell aus den USA. Der Benchmark bündelt 10 Bewertungen, die Reasoning, Coding, Allgemeinwissen und agentische Performance abdecken.
Wie vergleicht sich die Geschwindigkeit von Nemotron 3 Ultra mit chinesischen Modellen? Nemotron 3 Ultra lieferte auf einem Pre-Release-DeepInfra-Endpoint über 300 Output-Tokens pro Sekunde, während die chinesischen Modelle DeepSeek V4 Pro und Kimi K2.6 über ihre kommerziellen APIs mit 50–100 Tokens pro Sekunde arbeiten.
Wann wird Nvidias Nemotron 3 Ultra verfügbar? Nemotron 3 Ultra erscheint am 4. Juni. Nutzer können auf das Modell über Nvidias API oder Cloud-Provider zugreifen, wobei öffentliche Gewichte und Trainingsrezepte veröffentlicht werden.
Related News
Alphabet strebt 80 Milliarden US-Dollar an, um die Expansion der KI-Infrastruktur zu finanzieren
NVIDIA arbeitet mit Unitree an einem Referenzdesign für den humanoiden Roboter H2+
Intel greift Nvidia und AMD mit neuem KI-Chip an
NVIDIA bringt den RTX Spark-PC-Chip und die Vera-CPU auf der COMPUTEX 2026 auf den Markt
OpenAI kündigt die Einführung einer Robotik-Sparte am 1. Juni an