OpenAI y Broadcom presentan el chip de IA Jalapeño para inferencia de LLM

TIA1,97%

OpenAI y Broadcom presentaron Jalapeño el 24 de junio de 2026, un chip acelerador de IA diseñado a medida específicamente para inferencia de modelos de lenguaje grandes. El chip representa el primer Procesador de Inteligencia de OpenAI y el componente inicial de una plataforma de cómputo planificada de múltiples generaciones desarrollada conjuntamente por ambas empresas, con el objetivo declarado de mejorar la velocidad, eficiencia y accesibilidad de los sistemas de IA avanzados. Este hito refleja una dirección estratégica más amplia en la que OpenAI trabaja cada vez más por el control sobre la pila completa de infraestructura que sustenta sus modelos y aplicaciones, en lugar de depender únicamente de plataformas de cómputo externas.

Arquitectura y especificaciones técnicas de Jalapeño

Jalapeño fue diseñado desde cero basándose en investigaciones internas sobre los requisitos de la inferencia moderna de LLM. Su arquitectura refleja las perspectivas derivadas de la hoja de ruta de desarrollo de modelos de OpenAI, incluyendo consideraciones sobre optimización del kernel, manejo de memoria, redes y sistemas de servicio. El chip fue desarrollado en colaboración con Broadcom y Celestia, que contribuyeron a los procesos de fabricación, integración de placas y bastidores, sistemas de red e infraestructura de despliegue a gran escala. Según las empresas, el diseño pretende mantenerse flexible para diferentes modelos de lenguaje grandes, sin limitarse a una única arquitectura o línea de productos.

Las muestras de ingeniería iniciales ya están ejecutando cargas de trabajo de aprendizaje automático en entornos de laboratorio a la frecuencia operativa y niveles de potencia objetivo, incluyendo cargas de trabajo asociadas con modelos avanzados como GPT-5.3-Codex-Spark. Las evaluaciones internas iniciales sugieren que Jalapeño podría lograr un mejor rendimiento por vatio en comparación con los principales aceleradores de IA existentes. Se dice que la arquitectura enfatiza la reducción del movimiento de datos y una distribución más equilibrada de los recursos de cómputo, memoria y red, con el objetivo de acercar la utilización en el mundo real a los límites teóricos del hardware. Las tecnologías de silicio de Broadcom, incluidos sus componentes de red Tomahawk, se posicionan como habilitadores clave para el despliegue a gran escala.

Roles de la asociación con Broadcom y Celestia

El chip fue desarrollado en colaboración con Broadcom y Celestia. Broadcom contribuyó con tecnologías de silicio y componentes de red, incluidos los sistemas de red Tomahawk. Celestia contribuyó a los procesos de fabricación, integración de placas y bastidores, sistemas de red e infraestructura de despliegue a gran escala. El diseño se basa en sistemas de producción utilizados en productos como ChatGPT, Codex y servicios basados en API, así como en los requisitos anticipados para futuras aplicaciones basadas en agentes.

Estrategia de integración de infraestructura de pila completa de OpenAI

La empresa ha enmarcado el desarrollo como parte de un cambio más amplio hacia un modelo económico impulsado por el cómputo. En este contexto, el chip se presenta como un esfuerzo para aumentar la disponibilidad de recursos de cómputo, reducir los costos operativos y mejorar la capacidad de respuesta de los sistemas de IA en aplicaciones de consumo y empresariales. La estrategia subyacente implica una integración más estrecha entre el desarrollo de modelos, el diseño de hardware y el despliegue de infraestructura, permitiendo la optimización en todo el sistema en lugar de en componentes aislados.

El enfoque de ingeniería detrás de Jalapeño está altamente especializado para la inferencia de LLM en lugar de cargas de trabajo de cómputo generalizadas. Se basa en sistemas de producción utilizados en productos como ChatGPT, Codex y servicios basados en API, así como en los requisitos anticipados para futuras aplicaciones basadas en agentes. El objetivo de diseño es combinar un alto rendimiento con una latencia reducida, permitiendo un rendimiento más receptivo para casos de uso interactivos de IA a escala.

Un aspecto clave del programa es el codiseño de sistemas de software y hardware, donde los modelos y la infraestructura evolucionan juntos. Esto incluye la arquitectura del chip, los sistemas de memoria, las capas de red, los mecanismos de programación y los marcos de despliegue. Al alinear estos componentes, se pretende mejorar la eficiencia y reducir el costo por unidad de inteligencia entregada.

La estrategia de plataforma más amplia posiciona a Jalapeño como el primer paso en una hoja de ruta de infraestructura a largo plazo programada para un despliegue por fases a partir de 2026, que incorpora contribuciones de Broadcom en silicio y redes, y de Celestia en integración de sistemas.

FAQ

¿Qué anunciaron OpenAI y Broadcom el 24 de junio de 2026?

OpenAI y Broadcom anunciaron Jalapeño, un chip acelerador de IA diseñado a medida específicamente para inferencia de modelos de lenguaje grandes. El chip representa el primer Procesador de Inteligencia de OpenAI y el componente inicial de una plataforma de cómputo planificada de múltiples generaciones desarrollada conjuntamente por ambas empresas.

¿Qué cargas de trabajo están ejecutando las muestras de ingeniería iniciales de Jalapeño?

Las muestras de ingeniería iniciales ya están ejecutando cargas de trabajo de aprendizaje automático en entornos de laboratorio a la frecuencia operativa y niveles de potencia objetivo, incluyendo cargas de trabajo asociadas con modelos avanzados como GPT-5.3-Codex-Spark.

¿Cuándo está programado que comience el despliegue por fases de Jalapeño?

La estrategia de plataforma más amplia posiciona a Jalapeño como el primer paso en una hoja de ruta de infraestructura a largo plazo programada para un despliegue por fases a partir de 2026.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios