OpenAI und Broadcom stellen Jalapeño vor, den ersten maßgeschneiderten KI-Chip für LLM-Inferenz.

OpenAI und Broadcom haben heute Jalapeño vorgestellt, den ersten Intelligence-Prozessor von OpenAI, der für das Inferencing großer Sprachmodelle entwickelt wurde. Der Chip wurde OpenAI-CEO Sam Altman und Präsident Greg Brockman von Broadcom-Präsident und CEO Hock Tan sowie Präsident Charlie Kawwas überreicht. Der Beschleuniger ist der erste KI-Chip in einer Multi-Generationen-Compute-Plattform, die die Unternehmen gemeinsam aufbauen, um fortschrittliche KI schneller, zuverlässiger und zugänglicher zu machen. OpenAI hat den Chip von Grund auf auf der Grundlage seines Verständnisses der LLM-Grundlagen entwickelt, wobei Broadcom und Celestica bei der Industrialisierung der Plattform durch Chip-Implementierung, Board- und Rack-Systemintegration, Hochleistungsvernetzung und skalierbare Produktionssysteme halfen.

OpenAI und Broadcom liefern Jalapeño-Chip an die Unternehmensführung

Die Chip-Lieferung markiert einen wichtigen Schritt in OpenAIs Strategie, den gesamten Stack hinter seinen Modellen und Produkten aufzubauen. Jalapeño wurde in Zusammenarbeit zwischen OpenAI, Broadcom und Celestica entwickelt, wobei jeder Partner spezialisiertes Fachwissen zur Plattform beisteuerte.

OpenAI entwarf die Chip-Architektur auf der Grundlage seiner Roadmap von Modellen, Kernels, Serving-Systemen und Produktanforderungen. Broadcom steuerte Chip-Implementierung und Netzwerktechnologien bei, darunter Tomahawk-Silizium, um die Plattform in die groß angelegte Produktion zu bringen. Celestica lieferte Fachwissen zu Board- und Rack-Systemintegration sowie skalierbaren Produktionssystemen.

Jalapeño-Architektur für LLM-Inferencing-Workloads optimiert

Jalapeño ist flexibel ausgelegt, um mit allen LLMs zu arbeiten, gestützt auf OpenAIs Erkenntnisse zu den Inferencing-Anforderungen aktueller und zukünftiger KI-Modelle in der gesamten Branche. Ingenieursmuster führen bereits ML-Workloads im Labor bei angestrebter Produktionsfrequenz und -leistung aus, darunter GPT-5.3-Codex-Spark.

Erste Tests zeigen, dass Jalapeño eine deutlich bessere Leistung pro Watt als der aktuelle Stand der Technik liefern wird. Die Architektur reduziert Datenbewegungen und gleicht Rechen-, Speicher- und Netzwerkressourcen aus, um eine realisierte Auslastung zu erreichen, die viel näher an der theoretischen Spitzenleistung liegt. Ein detaillierter technischer Bericht wird in den kommenden Monaten vorgelegt.

„Jalapeño wurde von Grund auf für das LLM-Inferencing entwickelt, unter Nutzung detaillierter Erkenntnisse aus unserer engen Zusammenarbeit mit OpenAI-Forschern“, sagte Richard Ho, der das Hardware-Programm von OpenAI leitet. „Wir haben die Architektur um die Kernels, Speicherbewegungen, Vernetzung und Serving-Muster optimiert, die für KI-Modelle der Spitzenklasse am wichtigsten sind. Ersten Tests zufolge wird Jalapeño unsere wichtigsten Workloads nahe an den theoretischen Grenzen der Hardware effizient ausführen.“

Der Chip ist ein kompletter Neuentwurf für modernes LLM-Inferencing, kein general-purpose-Beschleuniger, der aus früheren KI-Workloads abgeleitet wurde. Er wird von den Systemen beeinflusst, die OpenAI jeden Tag in ChatGPT, Codex, der API und zukünftigen agentischen Produkten betreibt. Ziel ist es, die Leistung und den Durchsatz der heutigen führenden KI-Beschleuniger mit einer Latenz zu kombinieren, die den schnellsten spezialisierten Inferencing-Systemen näher kommt.

Entwicklung in neun Monaten mit KI-gestütztem Design abgeschlossen

Jalapeño wurde vom ersten Design bis zum Tape-Out für die Fertigung in nur neun Monaten gemeinschaftlich entwickelt. Die Unternehmen glauben, dass dies der schnellste ASIC-Entwicklungszyklus ist, der jemals in Hochleistungs-Halbleitern der Spitzenklasse erreicht wurde.

Der beschleunigte Zeitplan spiegelt die tiefgreifende gemeinsame Entwicklung von Software und Hardware mit OpenAIs Ingenieurteams, Broadcoms Silizium-Implementierungsexpertise und den Einsatz von OpenAI-Modellen zur Beschleunigung von Teilen des Design- und Optimierungsprozesses wider. Dieselben Modelle, die den Nutzern zur Verfügung stehen, helfen dabei, die Infrastruktur zu verbessern, die für die Ausführung zukünftiger Modelle verwendet wird.

Multi-Generationen-Compute-Plattform mit Broadcom und Celestica geplant

Jalapeño ist der erste Schritt in einer Multi-Generationen-Compute-Plattform, die von OpenAI entwickelte Beschleuniger mit Broadcoms Silizium-Implementierung, Netzwerk- und Konnektivitätstechnologien sowie Celesticas Board-, Rack- und Systemexpertise kombiniert.

„Die Welt bewegt sich in eine computergestützte Wirtschaft“, sagte Greg Brockman, Präsident und Mitgründer von OpenAI. „Jalapeño ist Teil unserer langfristigen Full-Stack-Infrastrukturstrategie, um Rechenleistung reichlicher verfügbar zu machen, was zu KI führt, die schneller, zuverlässiger und erschwinglicher für Menschen und Unternehmen ist und zur Lösung wichtigerer Probleme eingesetzt werden kann. Indem wir mehr vom Stack selbst entwerfen, können wir mehr Intelligenz mit größerer Effizienz bereitstellen und fortschrittliche KI weiter in Richtung breiteren Zugangs treiben.“

Bereitstellung bis Ende 2026 geplant

Die Multi-Generationen-Compute-Plattform ist für die erstmalige Bereitstellung bis Ende 2026 und eine Ausweitung in den folgenden Jahren ausgelegt. OpenAI arbeitet über den gesamten Stack hinweg, einschließlich Chip-Architektur, Kernels, Speichersystemen, Vernetzung, Planung, Bereitstellungssystemen und Produkterfahrung, wobei jede Schicht darauf optimiert ist, seine Modelle für die Nutzer schneller, zuverlässiger und erschwinglicher zu machen.

FAQ

Was ist Jalapeño und wann wurde es vorgestellt?

Jalapeño ist der erste Intelligence-Prozessor von OpenAI, ein KI-Beschleuniger, der speziell für das Inferencing großer Sprachmodelle entwickelt wurde. OpenAI und Broadcom haben den Chip heute vorgestellt.

Wie lange hat die Entwicklung von Jalapeño gedauert?

Jalapeño wurde vom ersten Design bis zum Tape-Out für die Fertigung in neun Monaten gemeinschaftlich entwickelt. Die Unternehmen glauben, dass dies der schnellste ASIC-Entwicklungszyklus ist, der jemals in Hochleistungs-Halbleitern der Spitzenklasse erreicht wurde.

Wann wird Jalapeño bereitgestellt?

Die Multi-Generationen-Compute-Plattform mit Jalapeño ist für die erstmalige Bereitstellung bis Ende 2026 ausgelegt, mit einer Ausweitung in den folgenden Jahren.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare