
Der CEO von Nvidia, Jensen Huang, erklärte in seiner Rede auf der GTC Taipei 2026 die Architekturdefinition von KI-Agenten: Ein Large Language Model (LLM) übernimmt das Denken, die Schlussfolgerung und die Planung, während eine externe Orchestrierungs-Engine (harness) wie ein Betriebssystem funktioniert, das Modell mit Tools wie elektronischen Tabellen, Browser und Datenbanken verbindet und dabei Arbeitsgedächtnis sowie Langzeitgedächtnis verwaltet.
Architekturdefinition von KI-Agenten: Großes Modell plus Orchestrierungs-Engine
In der Rede unterteilt Jensen Huang die Kernstruktur von KI-Agenten in zwei Teile: Das Large Language Model als „Denk-Zentrale“ übernimmt Schlussfolgerung und Planung; die externe Orchestrierungs-Engine übernimmt die Rolle eines Betriebssystems, verbindet das Modell mit verschiedenen Tools und verwaltet zugleich das kurzfristige Arbeitsgedächtnis und das langfristige Gedächtnis.
Er wies darauf hin, dass diese Architektur eine grundlegende Änderung im Rechenmodus darstellt – nicht einfach ein Upgrade von Effizienzwerkzeugen. Bei der Vorführung vor Ort sagte er: „Wir verwenden hier Claude Code, aber Codex zeigt sich genauso leistungsfähig.“
Drei bestätigte Demo-Fälle vor Ort auf der GTC Taipei
In seiner Rede zeigte Jensen Huang live drei Beispiele für KI-Agenten: Erstens generierte der Agent durch reine Natursprach-Eingaben direkt vollständigen Anwendungsquellcode. Zweitens erzeugte der Agent sofort eine dynamische Partikelanimation mit einem Thema rund um „Taipei 101 → GTC Taipei 2026 → NVIDIA-Logo“, nachdem ihm eine Textbeschreibung gegeben wurde. Drittens fotografierte das Publikum vor Ort einen Fernbedienungs-Batterieclip mit fehlendem Teil; der Agent rief automatisch ein CAD-Tool auf, um eine Ersatzteil-Datei zu erstellen, die sich direkt für den 3D-Druck verwenden lässt.
Widerlegung der These vom Software-Zusammenbruch: „Jetzt ist die beste Zeit, um Software-Firmen zu machen“
Mit Blick auf die in Umlauf gebrachte Aussage „KI-Agenten werden Software-Firmen in den Ruin treiben“ widersprach Jensen Huang klar: „Ganz im Gegenteil.“ Er erklärte, dass Agenten nicht mehr durch die Zahl der Menschen begrenzt seien und dann „mehr Software-Tools als Menschen“ nutzen würden. „Jetzt ist die beste Zeit, um Software-Firmen zu machen“ – aber nur unter der Voraussetzung, dass Software so entworfen und präsentiert wird, dass Agenten sie direkt aufrufen können. Nvidias CUDA-X-Bibliothek wird umfassend für Agenten geöffnet; die Effizienz, mit der Agenten sie nutzen, übersteigt sogar die von menschlichen Entwicklern.
Häufige Fragen
Was ist der grundlegende Unterschied zwischen dem von Jensen Huang definierten KI-Agenten und traditionellen Softwareanwendungen?
Der von Jensen Huang auf der GTC Taipei 2026 definierte KI-Agent besteht aus einem LLM (für Schlussfolgerung und Planung) und einer Orchestrierungs-Engine (Tool-Verbindung + Gedächtnisverwaltung). Traditionelle Software ist „Starten – Klicken – Eingeben“, während der Agent-Modus lautet: „Der KI die Absicht beschreiben, die KI generiert automatisch Code, ruft Tools auf und gibt Ergebnisse aus“ – der operative Schwerpunkt wechselt von Menschen zur KI selbst.
Was zeigt das Beispiel des 3D-Drucks für den Fernbedienungs-Batterieclip?
Diese Vorführung zeigt die Fähigkeit von Agenten, mehrere Tools aufzurufen: Der Agent erkennt das Problem auf dem Foto (fehlender Batterieclip), versteht die Anforderung (Ersatzteil wird benötigt), ruft ein CAD-Tool für das Modellieren auf und gibt direkt eine Datei aus, die für den 3D-Druck geeignet ist. So wurde ein vollständiger Workflow von der Problemidentifikation bis zur Lösung abgeschlossen, ohne dass Menschen schrittweise eingreifen müssen.
Was bedeutet die vollständige Öffnung von CUDA X für Agenten?
Jensen Huang kündigte an, dass Nvidias CUDA-X-Bibliothek vollständig für KI-Agenten geöffnet ist und dass die Nutzungseffizienz der Agenten die menschlicher Entwickler übertrifft. Das bedeutet, dass Nvidias zentrale KI-Beschleunigungs-Infrastruktur offiziell auf die Agent-Entwicklungs-Ökologie ausgeweitet wird und Entwicklern eine effizientere Grundlage für Tool-Aufrufe bietet.