Nvidia stellt auf der Computex Nemotron 3 Ultra vor und folgt Chinas Kimi K2.6 in den Intelligence-Rankings

2026-06-01 22:52:58

Nvidia stellte am 1. Juni auf der Computex in Taipeh Nemotron 3 Ultra vor, ein Open-Weight-KI-Modell mit 550 Milliarden Parametern, das die bisher größte Open-KI-Veröffentlichung des Unternehmens darstellt. CEO Jensen Huang kündigte das Modell während seiner Keynote an und positionierte es als bestplatziertes Open-Weight-Modell der USA auf Intelligenz-Benchmarks. Die Veröffentlichung verschärft den Wettbewerb im Bereich der Open-Weight-KI, in dem chinesische Modelle einschließlich Kimi K2.6 von Moonshot AI derzeit die globalen Intelligenz-Rankings anführen – trotz Nvidias Geschwindigkeitsvorteilen.

Nemotron 3 Ultra erzielt 48 im Intelligence-Index-Benchmark

Artificial Analysis, das für die Vorab-Evaluierung mit Nvidia zusammenarbeitete, setzte Nemotron 3 Ultra auf 48 im Intelligence Index. Der zusammengesetzte Benchmark bündelt 10 Bewertungen über Reasoning, Coding, Allgemeinwissen und agentische Performance. Die Punktzahl macht Nemotron 3 Ultra zum Top-Open-Weight-Modell aus den USA und liegt damit vor Googles Gemma 4 31B mit 39, Nvidias eigenem Nemotron 3 Super mit 36 sowie OpenAIs gpt-oss-120b mit 33.

Das Modell verwendet eine Mixture-of-Experts-Architektur mit insgesamt 550 Milliarden Parametern, aktiviert jedoch jeweils nur 55 Milliarden zu einem gegebenen Zeitpunkt. Dieses Design senkt die Betriebskosten, während die Performance bei komplexen Reasoning-Aufgaben erhalten bleibt.

Modell liefert 300+ Tokens pro Sekunde auf Pre-Release-Endpoint

Nemotron 3 Ultra lieferte laut Tests von Artificial Analysis auf einem Pre-Release-DeepInfra-Endpoint über 300 Output-Tokens pro Sekunde. Chinesische Modelle in derselben Intelligenzklasse – DeepSeek V4 Pro und Kimi K2.6 – arbeiten derzeit mit 50–100 Tokens pro Sekunde über ihre kommerziellen APIs. Nvidia behauptet, das Modell sei fünfmal schneller als vergleichbare Open-Weight-Alternativen und die Kosten lägen 30% niedriger.

Die Architektur kombiniert Mamba-2-Layer, standardmäßige Transformer-Attention und Mixture-of-Experts-Routing. Das Modell unterstützt ein 1-Million-Token-Context-Fenster und integriert Multi-Token-Prediction (MTP), die mehrere zukünftige Tokens gleichzeitig generiert – statt sequenziell.

Kimi K2.6 führt Open-Weight-Rankings mit 54 Intelligence-Score an

Kimi K2.6 von Moonshot AI belegt die Spitzenposition unter den Open-Weight-Modellen mit einem Intelligence-Index-Score von 54, sechs Punkte vor Nemotron 3 Ultra. Das im April veröffentlichte Kimi K2.6 belegt global Platz vier unter allen KI-Modellen und liegt drei Punkte hinter den proprietären Flaggschiffen von Anthropic, Google und OpenAI, die sich bei 57 einordnen.

Chinesische Open-Source-Modelle erhöhten ihren Anteil an der globalen Nutzung von Open-Modellen von etwa 1,2% Ende 2024 auf rund 30% bis Ende 2025, wie im März berichtet wurde.

Nemotron-Familie umfasst seit 2023 drei Modellgrößen

Nvidia brachte sein erstes Nemotron-Modell unter eigenem Branding im November 2023 heraus, die dritte Generation wurde im Dezember 2025 angekündigt. Die Familie umfasst drei Größen: Nano für leichte Aufgaben, Super für Enterprise-Anwendungen im mittleren Bereich und Ultra für komplexe Reasoning-Workloads. Alle drei Modelle nutzen dieselbe hybride Architektur aus Mamba-2-Layern, Transformer-Attention und Mixture-of-Experts-Routing.

Nemotron 3 Super, das im März mit 120 Milliarden Parametern veröffentlicht wurde, erzielte 36 im Intelligence Index. Der 12-Punkte-Anstieg von Nemotron 3 Ultra stellt einen bedeutenden Fortschritt innerhalb der Produktlinie dar.

Nvidia stellt 26 Milliarden US-Dollar für Open-Weight-KI-Entwicklung bereit

Nvidia gab einen Fünfjahresplan bekannt, um 26 Milliarden US-Dollar in die Entwicklung von Open-Weight-KI zu investieren. Das Unternehmen bildete im März die Nemotron Coalition – eine Gruppe aus acht KI-Labs, darunter Mistral AI und Perplexity – um gemeinsam Open-Frontier-Modelle auf der DGX-Cloud-Infrastruktur zu entwickeln. Nvidia kündigte an, dass man an Nemotron 4 arbeitet, der nächsten Generation in der Modellfamilie.

Modell erscheint am 4. Juni über Nvidia API und Cloud-Provider

Nemotron 3 Ultra erscheint am 4. Juni. Die Modellgewichte sind öffentlich und Trainingsrezepte werden veröffentlicht. Nutzer können auf das Modell über Nvidias API oder Cloud-Provider zugreifen, ohne dedizierte Rechenzentrums-Hardware zu benötigen.

FAQ

Welchen Intelligence-Score hat Nvidias Nemotron 3 Ultra am 1. Juni erreicht? Nemotron 3 Ultra erzielte 48 im Artificial-Analysis-Intelligence-Index und ist damit das bestplatzierte Open-Weight-Modell aus den USA. Der Benchmark bündelt 10 Bewertungen, die Reasoning, Coding, Allgemeinwissen und agentische Performance abdecken.

Wie vergleicht sich die Geschwindigkeit von Nemotron 3 Ultra mit chinesischen Modellen? Nemotron 3 Ultra lieferte auf einem Pre-Release-DeepInfra-Endpoint über 300 Output-Tokens pro Sekunde, während die chinesischen Modelle DeepSeek V4 Pro und Kimi K2.6 über ihre kommerziellen APIs mit 50–100 Tokens pro Sekunde arbeiten.

Wann wird Nvidias Nemotron 3 Ultra verfügbar? Nemotron 3 Ultra erscheint am 4. Juni. Nutzer können auf das Modell über Nvidias API oder Cloud-Provider zugreifen, wobei öffentliche Gewichte und Trainingsrezepte veröffentlicht werden.

View Source

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.