A OpenAI e a Broadcom apresentaram hoje o Jalapeño, o primeiro Processador de Inteligência da OpenAI, projetado para inferência em modelos de linguagem de grande escala. O chip foi entregue ao CEO da OpenAI, Sam Altman, e ao Presidente Greg Brockman pelo Presidente e CEO da Broadcom, Hock Tan, e pelo Presidente Charlie Kawwas. O acelerador representa o primeiro chip de IA numa plataforma de computação multigeracional que as empresas estão a construir em conjunto para tornar a IA avançada mais rápida, fiável e acessível. A OpenAI concebeu o chip de raiz com base no seu entendimento dos fundamentos dos LLM, com a Broadcom e a Celestica a ajudar a industrializar a plataforma através da implementação do chip, integração de placas e sistemas em rack, rede de alto desempenho e sistemas de produção escaláveis.
A entrega do chip marca um passo importante na estratégia da OpenAI para construir a pilha completa por detrás dos seus modelos e produtos. O Jalapeño foi desenvolvido através da colaboração entre a OpenAI, a Broadcom e a Celestica, com cada parceiro a contribuir com conhecimentos especializados para a plataforma.
A OpenAI concebeu a arquitetura do chip informada pelo seu roteiro de modelos, kernels, sistemas de serviço e necessidades de produto. A Broadcom contribuiu com a implementação do chip e tecnologias de rede, incluindo o silício Tomahawk, para levar a plataforma à produção em grande escala. A Celestica forneceu conhecimentos em integração de placas e sistemas em rack e sistemas de produção escaláveis.
O Jalapeño foi concebido com flexibilidade para funcionar com todos os LLM, guiado pelas perceções da OpenAI sobre as necessidades de inferência dos modelos de IA atuais e futuros em toda a indústria. As amostras de engenharia já estão a executar cargas de trabalho de ML no laboratório à frequência e potência alvo de produção, incluindo o GPT-5.3-Codex-Spark.
Os testes iniciais mostram que o Jalapeño proporcionará um desempenho por watt substancialmente melhor do que o estado da arte atual. A arquitetura reduz a movimentação de dados e equilibra os recursos de computação, memória e rede para alcançar uma utilização realizada muito mais próxima do desempenho máximo teórico. Um relatório técnico detalhado será apresentado nos próximos meses.
"O Jalapeño foi concebido de raiz para inferência de LLM utilizando conhecimentos detalhados da nossa estreita colaboração com os investigadores da OpenAI", afirmou Richard Ho, que lidera o programa de hardware da OpenAI. "Otimizámos a arquitetura em torno dos kernels, movimentação de memória, rede e padrões de serviço que mais importam para os modelos de IA de fronteira. Com base nos testes iniciais, o Jalapeño executará eficientemente as nossas cargas de trabalho mais importantes perto dos limites teóricos do hardware."
O chip é um design de raiz para inferência moderna de LLM, não um acelerador de uso geral adaptado de cargas de trabalho de IA anteriores. É informado pelos sistemas que a OpenAI opera diariamente no ChatGPT, Codex, API e futuros produtos agênticos. O objetivo é combinar a potência e a capacidade de processamento dos principais aceleradores de IA atuais com uma latência mais próxima dos sistemas de inferência especializados mais rápidos.
O Jalapeño foi co-desenvolvido desde o design inicial até ao tape-out de fabrico em apenas nove meses. As empresas acreditam que este é o ciclo de desenvolvimento de ASIC mais rápido alguma vez alcançado em semicondutores avançados de alto desempenho.
O cronograma acelerado reflete o co-desenvolvimento profundo de software e hardware com as equipas de engenharia da OpenAI, a experiência em implementação de silício da Broadcom e a utilização de modelos da OpenAI para acelerar partes do processo de design e otimização. Os mesmos modelos que são servidos aos utilizadores estão a ajudar a melhorar a infraestrutura usada para executar modelos futuros.
O Jalapeño é o primeiro passo de uma plataforma de computação multigeracional que combina aceleradores concebidos pela OpenAI com implementação de silício, rede e tecnologias de conectividade da Broadcom, e a experiência em placas, racks e sistemas da Celestica.
"O mundo está a mover-se para uma economia movida a computação", afirmou Greg Brockman, Presidente e Co-Fundador da OpenAI. "O Jalapeño faz parte da nossa estratégia de infraestrutura de pilha completa a longo prazo para tornar a computação mais abundante, resultando numa IA mais rápida, fiável, acessível para pessoas e empresas, e que pode ser usada para resolver problemas mais importantes. Ao concebermos mais da pilha nós próprios, podemos servir mais inteligência com maior eficiência e continuar a impulsionar a IA avançada para um acesso mais alargado."
A plataforma de computação multigeracional está concebida para implementação inicial até ao final de 2026 e expansão nos anos seguintes. A OpenAI opera em toda a pilha completa, incluindo arquitetura de chip, kernels, sistemas de memória, rede, escalonamento, sistemas de implementação e experiência do produto, com cada camada otimizada para tornar os seus modelos mais rápidos, fiáveis e acessíveis para os utilizadores.
O que é o Jalapeño e quando foi apresentado?
O Jalapeño é o primeiro Processador de Inteligência da OpenAI, um acelerador de IA concebido especificamente para inferência em modelos de linguagem de grande escala. A OpenAI e a Broadcom apresentaram o chip hoje.
Quanto tempo demorou a desenvolver o Jalapeño?
O Jalapeño foi co-desenvolvido desde o design inicial até ao tape-out de fabrico em nove meses. As empresas acreditam que este é o ciclo de desenvolvimento de ASIC mais rápido alguma vez alcançado em semicondutores avançados de alto desempenho.
Quando será implementado o Jalapeño?
A plataforma de computação multigeracional que apresenta o Jalapeño está concebida para implementação inicial até ao final de 2026, com expansão planeada nos anos seguintes.
Notícias relacionadas
Qualcomm apresenta CPU Dragonfly C1000 para data center, Meta primeiro cliente
Cambrian angaria $6M para financiamento inicial de rede de oráculo de dados blockchain
OpenAI e Broadcom Revelam Chip de IA Personalizado Jalapeño para Inferência
Engram eleva $98M para reduzir os custos do token de IA para clientes empresariais
O modelo GLM-5.2 da z.AI ganha atenção nos EUA com alto desempenho a baixo custo