A OpenAI e a Broadcom apresentaram hoje o Jalapeño, o primeiro Processador de Inteligência da OpenAI, projetado para inferência em modelos de linguagem de grande escala. O chip foi entregue ao CEO da OpenAI, Sam Altman, e ao Presidente Greg Brockman pelo Presidente e CEO da Broadcom, Hock Tan, e pelo Presidente Charlie Kawwas. O acelerador representa o primeiro chip de IA numa plataforma de computação multigeracional que as empresas estão a construir em conjunto para tornar a IA avançada mais rápida, fiável e acessível. A OpenAI concebeu o chip de raiz com base no seu entendimento dos fundamentos dos LLM, com a Broadcom e a Celestica a ajudar a industrializar a plataforma através da implementação do chip, integração de placas e sistemas em rack, rede de alto desempenho e sistemas de produção escaláveis.

OpenAI e Broadcom Entregam Chip Jalapeño à Liderança da Empresa

A entrega do chip marca um passo importante na estratégia da OpenAI para construir a pilha completa por detrás dos seus modelos e produtos. O Jalapeño foi desenvolvido através da colaboração entre a OpenAI, a Broadcom e a Celestica, com cada parceiro a contribuir com conhecimentos especializados para a plataforma.

A OpenAI concebeu a arquitetura do chip informada pelo seu roteiro de modelos, kernels, sistemas de serviço e necessidades de produto. A Broadcom contribuiu com a implementação do chip e tecnologias de rede, incluindo o silício Tomahawk, para levar a plataforma à produção em grande escala. A Celestica forneceu conhecimentos em integração de placas e sistemas em rack e sistemas de produção escaláveis.

Arquitetura do Jalapeño Otimizada para Cargas de Trabalho de Inferência de LLM

O Jalapeño foi concebido com flexibilidade para funcionar com todos os LLM, guiado pelas perceções da OpenAI sobre as necessidades de inferência dos modelos de IA atuais e futuros em toda a indústria. As amostras de engenharia já estão a executar cargas de trabalho de ML no laboratório à frequência e potência alvo de produção, incluindo o GPT-5.3-Codex-Spark.

Os testes iniciais mostram que o Jalapeño proporcionará um desempenho por watt substancialmente melhor do que o estado da arte atual. A arquitetura reduz a movimentação de dados e equilibra os recursos de computação, memória e rede para alcançar uma utilização realizada muito mais próxima do desempenho máximo teórico. Um relatório técnico detalhado será apresentado nos próximos meses.

"O Jalapeño foi concebido de raiz para inferência de LLM utilizando conhecimentos detalhados da nossa estreita colaboração com os investigadores da OpenAI", afirmou Richard Ho, que lidera o programa de hardware da OpenAI. "Otimizámos a arquitetura em torno dos kernels, movimentação de memória, rede e padrões de serviço que mais importam para os modelos de IA de fronteira. Com base nos testes iniciais, o Jalapeño executará eficientemente as nossas cargas de trabalho mais importantes perto dos limites teóricos do hardware."

O chip é um design de raiz para inferência moderna de LLM, não um acelerador de uso geral adaptado de cargas de trabalho de IA anteriores. É informado pelos sistemas que a OpenAI opera diariamente no ChatGPT, Codex, API e futuros produtos agênticos. O objetivo é combinar a potência e a capacidade de processamento dos principais aceleradores de IA atuais com uma latência mais próxima dos sistemas de inferência especializados mais rápidos.

Desenvolvimento Concluído em Nove Meses com Recurso a Design Assistido por IA

O Jalapeño foi co-desenvolvido desde o design inicial até ao tape-out de fabrico em apenas nove meses. As empresas acreditam que este é o ciclo de desenvolvimento de ASIC mais rápido alguma vez alcançado em semicondutores avançados de alto desempenho.

O cronograma acelerado reflete o co-desenvolvimento profundo de software e hardware com as equipas de engenharia da OpenAI, a experiência em implementação de silício da Broadcom e a utilização de modelos da OpenAI para acelerar partes do processo de design e otimização. Os mesmos modelos que são servidos aos utilizadores estão a ajudar a melhorar a infraestrutura usada para executar modelos futuros.

Plataforma de Computação Multigeracional Planeada com a Broadcom e a Celestica

O Jalapeño é o primeiro passo de uma plataforma de computação multigeracional que combina aceleradores concebidos pela OpenAI com implementação de silício, rede e tecnologias de conectividade da Broadcom, e a experiência em placas, racks e sistemas da Celestica.

"O mundo está a mover-se para uma economia movida a computação", afirmou Greg Brockman, Presidente e Co-Fundador da OpenAI. "O Jalapeño faz parte da nossa estratégia de infraestrutura de pilha completa a longo prazo para tornar a computação mais abundante, resultando numa IA mais rápida, fiável, acessível para pessoas e empresas, e que pode ser usada para resolver problemas mais importantes. Ao concebermos mais da pilha nós próprios, podemos servir mais inteligência com maior eficiência e continuar a impulsionar a IA avançada para um acesso mais alargado."

Implementação Agendada para o Final de 2026

A plataforma de computação multigeracional está concebida para implementação inicial até ao final de 2026 e expansão nos anos seguintes. A OpenAI opera em toda a pilha completa, incluindo arquitetura de chip, kernels, sistemas de memória, rede, escalonamento, sistemas de implementação e experiência do produto, com cada camada otimizada para tornar os seus modelos mais rápidos, fiáveis e acessíveis para os utilizadores.

FAQ

O que é o Jalapeño e quando foi apresentado?

O Jalapeño é o primeiro Processador de Inteligência da OpenAI, um acelerador de IA concebido especificamente para inferência em modelos de linguagem de grande escala. A OpenAI e a Broadcom apresentaram o chip hoje.

Quanto tempo demorou a desenvolver o Jalapeño?

O Jalapeño foi co-desenvolvido desde o design inicial até ao tape-out de fabrico em nove meses. As empresas acreditam que este é o ciclo de desenvolvimento de ASIC mais rápido alguma vez alcançado em semicondutores avançados de alto desempenho.

Quando será implementado o Jalapeño?

A plataforma de computação multigeracional que apresenta o Jalapeño está concebida para implementação inicial até ao final de 2026, com expansão planeada nos anos seguintes.

Ver fonte

Aviso legal: As informações contidas nesta página podem provir de fontes externas e têm caráter meramente informativo. Não refletem os pontos de vista nem as opiniões da Gate e não constituem qualquer tipo de aconselhamento financeiro, de investimento ou jurídico. A negociação de ativos virtuais envolve um risco elevado. Não se baseie exclusivamente nas informações contidas nesta página ao tomar decisões. Para mais detalhes, consulte o Aviso legal.

Notícias relacionadas

4h atrás

OpenAI apresenta Jalapeño, primeiro chip de IA personalizado construído com a Broadcom

6h atrás

OpenAI Lança Jalapeño, Chip de IA Personalizado Projetado por IA, num Recorde de 9 Meses

9h atrás

OpenAI e Broadcom Lançam Chip Jalapeño para Inferência de LLM em Escala

Qualcomm apresenta CPU Dragonfly C1000 para data center, Meta primeiro cliente

Oliver Grant13h atrás

Cambrian angaria $6M para financiamento inicial de rede de oráculo de dados blockchain

Oliver Grant15h atrás

OpenAI e Broadcom Revelam Chip de IA Personalizado Jalapeño para Inferência