OpenAI und Broadcom stellen am 25. Juni den Jalapeno AI Chip für LLM-Inferenz vor

Laut OpenAI haben das Unternehmen und Broadcom am 25. Juni Jalapeno vorgestellt, einen maßgeschneiderten KI-Beschleuniger, der speziell für das Inferencing großer Sprachmodelle entwickelt wurde. In Zusammenarbeit mit Broadcom und Celestica entwickelt, stellt Jalapeno die erste Komponente einer geplanten Multi-Generationen-Computing-Plattform dar, die darauf abzielt, Geschwindigkeit, Effizienz und Zugänglichkeit fortschrittlicher KI-Systeme zu verbessern. Der Chip basiert auf interner Forschung zu den Anforderungen des LLM-Inferencings und integriert Kernel-Optimierung, Speicherverwaltung, Vernetzung und Servingsysteme. Erste technische Muster laufen bereits mit maschinellen Lern-Workloads in Laborumgebungen, darunter auch solche, die mit fortschrittlichen Modellen wie GPT-5.3-Codex-Spark verbunden sind, und arbeiten mit Zielfrequenz und Leistungsniveaus. Die Architektur legt Wert auf reduzierte Datenbewegung und eine ausgewogene Ressourcenverteilung zwischen Rechenleistung, Speicher und Vernetzung und ist für den Einsatz mit verschiedenen großen Sprachmodellen ausgelegt.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare