NVIDIA hat auf der GTC-Konferenz den Physical AI Data Factory Blueprint vorgestellt, eine offene Referenzarchitektur, die darauf abzielt, die Datengenerierung und Bewertungsprozesse zu automatisieren. Durch modulare Workflows unterstützt sie Entwickler dabei, Rohdaten in hochwertige Trainingssets umzuwandeln, um die Kosten und technischen Hürden bei der groß angelegten Entwicklung von Robotern, visuellen KI-Agenten und autonomen Fahrzeugen zu senken.
Was ist der Physical AI Data Factory Blueprint?
Physical AI hängt stark vom gleichzeitigen Wachstum von Datenmengen und Modellkapazitäten ab. Der Blueprint bietet einen universellen Standard, der bisher fragmentierte Datenverarbeitungsprozesse in eine spezialisierte Automatisierungs-Pipeline integriert. Mit Cosmos Curator werden große Mengen realer und synthetischer Daten verarbeitet, extrahiert und annotiert. Anschließend nutzt Cosmos Transfer die ausgewählten Daten, um sie exponentiell zu erweitern und zu diversifizieren, um verschiedene Umgebungen, Lichtverhältnisse und seltene Randfälle im echten Leben zu simulieren. Abschließend bewertet der von Cosmos Reason angetriebene Evaluator die generierten Daten automatisch, um sicherzustellen, dass sie physikalisch genau sind und den Trainingsstandards entsprechen, wodurch die Effizienz der manuellen Datenüberprüfung verbessert wird.
Um den hohen Rechenbedarf zu decken, arbeitet NVIDIA mit Cloud-Anbietern wie Microsoft Azure und Nebius zusammen, um den Blueprint in bestehende Cloud-Infrastrukturen zu integrieren. Microsoft Azure hat diesen Ansatz in seine offene Physical AI Toolchain auf GitHub aufgenommen, die IoT-Operationen und Echtzeit-Intelligenzdienste kombiniert, um unternehmensgerechte, agentengesteuerte Workflows bereitzustellen. Nebius integriert das OSMO-Orchestrierungs-Framework in seine KI-Cloud-Plattform und unterstützt RTX PRO 6000 Blackwell Server-GPUs, um Entwicklern eine End-to-End-Stack-Lösung von Datenmanagement und Annotation bis hin zu serverlosem Inferenz-Hosting zu bieten. Diese Architektur ermöglicht es Entwicklern, Rechenleistung direkt in massenhafte Trainingsdaten umzuwandeln und so die Entwicklung autonomer Systeme zu beschleunigen.
NVIDIA OSMO Open-Source-Orchestrierungs-Framework für Management und Codierung von Agenten
Für Entwicklerteams, die keine umfangreiche Infrastruktur für KI-Management besitzen, führt der Physical AI Data Factory Blueprint das NVIDIA OSMO Open-Source-Orchestrierungs-Framework ein. OSMO ermöglicht die Verwaltung komplexer Workflows über verschiedene Rechenumgebungen hinweg, reduziert manuelle Eingriffe und erlaubt Technikteams, sich auf die Modelloptimierung zu konzentrieren. Derzeit ist OSMO bereits mit Codex, OpenAI Codex und Cursor integriert, um KI-native Operationen zu realisieren. In diesem Modus verwalten Agenten aktiv Rechenressourcen, erkennen Systemengpässe und eliminieren sie, wodurch die Entwicklungs- und Bereitstellungszyklen verkürzt werden.
Mehrere Unternehmen im Bereich der physischen KI-Entwicklung haben bereits begonnen, den Blueprint zu implementieren. Skild AI nutzt ihn für die Entwicklung allgemeiner Robotergrundmodelle; Uber setzt ihn für die Entwicklung und Validierung autonomer Fahrzeuge ein. Zudem stärken FieldAI, Hexagon Robotics, BMW, Linker Vision, Milestone Systems und Teradyne Robotics ihre Fähigkeiten in den Bereichen Wahrnehmung, Mobilität und Reinforcement Learning durch den Einsatz dieses Blueprints.
Dieser Artikel erschien zuerst bei GTC 2026: NVIDIA stellt Physical AI Data Factory Blueprint vor, um die Entwicklung von Robotern und autonomen Fahrzeugen zu beschleunigen auf ABMedia.