OpenAI e Broadcom revelam chip de IA Jalapeno para inferência de LLM em 25 de Junho

De acordo com a OpenAI, a empresa e a Broadcom apresentaram o Jalapeno em 25 de junho, um acelerador de IA personalizado projetado especificamente para inferência de modelos de linguagem grandes. Desenvolvido em parceria com a Broadcom e a Celestica, o Jalapeno representa o primeiro componente de uma plataforma de computação multigeracional planejada, visando melhorar a velocidade, eficiência e acessibilidade de sistemas avançados de IA. O chip foi construído a partir de pesquisas internas sobre requisitos de inferência de LLM e incorpora otimização de kernel, gerenciamento de memória, rede e sistemas de servidor. Amostras de engenharia iniciais já estão executando cargas de trabalho de aprendizado de máquina em ambientes laboratoriais, incluindo aquelas associadas a modelos avançados como GPT-5.3-Codex-Spark, operando nas frequências e níveis de energia alvo. A arquitetura enfatiza a redução do movimento de dados e a distribuição equilibrada de recursos entre computação, memória e rede, projetada para funcionar com diferentes modelos de linguagem grandes.
Isenção de responsabilidade: as informações nesta página podem ter origem em fontes terceiras e servem apenas como referência. Não representam as opiniões da Gate e não constituem orientação financeira, de investimentos ou jurídica. A negociação de ativos virtuais envolve alto risco. Não tome decisões baseando-se apenas nas informações desta página. Para mais detalhes, consulte a Isenção de responsabilidade.
Comentário
0/400
Sem comentários