OpenAI et Broadcom ont dévoilé aujourd'hui Jalapeño, le premier processeur d'inférence conçu par OpenAI spécifiquement pour l'inférence des LLM, marquant une étape clé dans la stratégie d'infrastructure full-stack d'OpenAI. La puce a été remise au PDG d'OpenAI, Sam Altman, et au président Greg Brockman par la direction de Broadcom.
Jalapeño a été développé de la conception initiale jusqu'au tape-out de fabrication en neuf mois, ce qui représente le cycle de développement ASIC le plus rapide dans le domaine des semi-conducteurs hautes performances, selon les deux entreprises. Les tests précoces montrent que la puce offre des performances par watt nettement supérieures à celles des systèmes les plus récents actuels, avec des échantillons d'ingénierie qui exécutent déjà des charges de travail de production, notamment GPT-5.3-Codex-Spark. La plateforme associe des accélérateurs conçus par OpenAI aux technologies de silicium et de réseau de Broadcom, avec un déploiement initial prévu pour fin 2026.