OpenAI et Broadcom ont dévoilé aujourd'hui Jalapeño, le premier processeur intelligent d'OpenAI conçu pour l'inférence de grands modèles de langage. La puce a été remise au PDG d'OpenAI Sam Altman et au président Greg Brockman par le président et PDG de Broadcom Hock Tan et le président Charlie Kawwas. L'accélérateur représente la première puce IA d'une plateforme de calcul multi-génération que les entreprises construisent ensemble pour rendre l'IA avancée plus rapide, plus fiable et plus accessible. OpenAI a conçu la puce de zéro en s'appuyant sur sa compréhension des fondamentaux des LLM, avec Broadcom et Celestica qui ont contribué à industrialiser la plateforme via l'implémentation de la puce, l'intégration des systèmes de carte et de rack, le réseau haute performance et les systèmes de production évolutifs.
La livraison de la puce marque une étape importante dans la stratégie d'OpenAI visant à construire la pile complète derrière ses modèles et produits. Jalapeño a été développé grâce à la collaboration entre OpenAI, Broadcom et Celestica, chaque partenaire apportant son expertise spécialisée à la plateforme.
OpenAI a conçu l'architecture de la puce en s'appuyant sur sa feuille de route de modèles, noyaux, systèmes de service et besoins produits. Broadcom a contribué à l'implémentation de la puce et aux technologies réseau, y compris le silicium Tomahawk, pour amener la plateforme à la production à grande échelle. Celestica a fourni l'expertise en intégration de cartes, systèmes de rack et systèmes de production évolutifs.
Jalapeño est conçu avec une flexibilité pour fonctionner avec tous les LLM, guidé par les connaissances d'OpenAI sur les besoins d'inférence des modèles d'IA actuels et futurs dans l'industrie. Des échantillons d'ingénierie exécutent déjà des charges de travail ML en laboratoire à la fréquence et puissance cibles de production, y compris GPT-5.3-Codex-Spark.
Les premiers tests montrent que Jalapeño offrira des performances par watt nettement supérieures à l'état de l'art actuel. L'architecture réduit les mouvements de données et équilibre les ressources de calcul, mémoire et réseau pour atteindre une utilisation réelle beaucoup plus proche des performances théoriques maximales. Un rapport technique détaillé sera présenté dans les mois à venir.
« Jalapeño a été conçu de toutes pièces pour l'inférence LLM en utilisant des informations détaillées de notre collaboration étroite avec les chercheurs d'OpenAI », a déclaré Richard Ho, qui dirige le programme matériel d'OpenAI. « Nous avons optimisé l'architecture autour des noyaux, des mouvements de mémoire, du réseau et des schémas de service qui comptent le plus pour les modèles d'IA de pointe. Sur la base des premiers tests, Jalapeño exécutera efficacement nos charges de travail les plus importantes près des limites théoriques du matériel. »
La puce est une conception de table rase pour l'inférence LLM moderne, et non un accélérateur à usage général adapté de charges de travail IA antérieures. Elle s'inspire des systèmes qu'OpenAI utilise chaque jour dans ChatGPT, Codex, l'API et les futurs produits agentiques. L'objectif est de combiner la puissance et le débit des principaux accélérateurs IA actuels avec une latence plus proche des systèmes spécialisés d'inférence les plus rapides.
Jalapeño a été co-développé de la conception initiale au tape-out de fabrication en seulement neuf mois. Les entreprises estiment que cela représente le cycle de développement ASIC le plus rapide jamais réalisé dans les semiconducteurs avancés haute performance.
Le calendrier accéléré reflète une co-développement logiciel-matériel approfondi avec les équipes d'ingénierie d'OpenAI, l'expertise en implémentation de silicium de Broadcom, et l'utilisation des modèles OpenAI pour accélérer certaines parties du processus de conception et d'optimisation. Les mêmes modèles servis aux utilisateurs aident à améliorer l'infrastructure utilisée pour exécuter les futurs modèles.
Jalapeño est la première étape d'une plateforme de calcul multi-génération combinant des accélérateurs conçus par OpenAI avec l'implémentation de silicium, les technologies réseau et de connectivité de Broadcom, et l'expertise en cartes, racks et systèmes de Celestica.
« Le monde évolue vers une économie alimentée par le calcul », a déclaré Greg Brockman, président et co-fondateur d'OpenAI. « Jalapeño fait partie de notre stratégie d'infrastructure full-stack à long terme pour rendre le calcul plus abondant, ce qui donne une IA plus rapide, plus fiable, plus abordable pour les particuliers et les entreprises, et pouvant être utilisée pour résoudre des problèmes plus importants. En concevant davantage de la pile nous-mêmes, nous pouvons fournir plus d'intelligence avec une plus grande efficacité et continuer à pousser l'IA avancée vers un accès plus large. »
La plateforme de calcul multi-génération est conçue pour un déploiement initial d'ici fin 2026 et une expansion dans les années à venir. OpenAI opère sur l'ensemble de la pile, y compris l'architecture des puces, les noyaux, les systèmes mémoire, le réseau, l'ordonnancement, les systèmes de déploiement et l'expérience produit, chaque couche étant optimisée pour rendre ses modèles plus rapides, plus fiables et plus abordables pour les utilisateurs.
Qu'est-ce que Jalapeño et quand a-t-il été dévoilé ?
Jalapeño est le premier processeur intelligent d'OpenAI, un accélérateur IA conçu spécifiquement pour l'inférence de grands modèles de langage. OpenAI et Broadcom ont dévoilé la puce aujourd'hui.
Combien de temps a-t-il fallu pour développer Jalapeño ?
Jalapeño a été co-développé de la conception initiale au tape-out de fabrication en neuf mois. Les entreprises estiment que cela représente le cycle de développement ASIC le plus rapide jamais réalisé dans les semiconducteurs avancés haute performance.
Quand Jalapeño sera-t-il déployé ?
La plateforme de calcul multi-génération intégrant Jalapeño est conçue pour un déploiement initial d'ici fin 2026, avec une expansion prévue dans les années à venir.
Actualités associées
Qualcomm dévoile le CPU Dragonfly C1000 pour centre de données, Meta premier client
Cambrian lève un tour de financement seed de $6M pour construire un réseau d'oracles de données blockchain.
OpenAI et Broadcom dévoilent la puce IA personnalisée Jalapeño dédiée à l'inférence
Engram lève $98M pour réduire les coûts des jetons d’IA pour les clients entreprises
Le modèle GLM-5.2 de z.AI attire l’attention aux États-Unis grâce à ses performances élevées à faible coût