《All-In Podcast》A mudança do campo de batalha da IA para a inferência, reinício da guerra dos chips de silício, e novas startups também podem se destacar

ChainNewsAbmedia

No episódio mais recente do 《All-In Podcast》, os quatro anfitriões revelaram que a OpenAI estabeleceu um acordo de cooperação importante com a startup americana de chips de IA Cerebras, e nos próximos três anos irá adquirir até 750 terawatts de capacidade de processamento, numa escala que chega a dezenas de bilhões de dólares. O foco desta transação não está no treino de modelos, mas sim na etapa crucial de comercialização de IA: (Inferência), ou seja, a capacidade de processamento necessária para que o modelo forneça respostas e serviços em tempo real ao exterior. Os quatro destacaram que isso simboliza uma mudança na competição da indústria de IA, que está passando de “quem treina o maior modelo” para “quem oferece a inferência mais rápida, estável e eficiente em termos de custo”.

Contrato de 750 terawatts em três anos, OpenAI prepara-se para inferência

No programa, foi mencionado que a OpenAI comprometeu-se a adquirir até 750 terawatts de recursos computacionais da Cerebras em três anos, equivalente à capacidade de uma grande central elétrica, para suportar a operação de sistemas de IA em aplicações práticas.

Os anfitriões enfatizaram que essa cooperação não visa treinar novos modelos, mas sim sustentar as demandas de inferência em tempo real do ChatGPT, serviços de API e diversas aplicações de IA. Com o aumento rápido do número de usuários e cenários de aplicação, a capacidade de processamento necessária para inferência será muito maior do que na fase de treinamento de modelos.

Tecnologia da Cerebras, uma abordagem diferente de chip

O convidado do programa explicou que, desde a sua fundação, a Cerebras optou por uma abordagem completamente diferente do design convencional de chips.

Normalmente, o processo de fabricação de chips envolve cortar uma grande pastilha de silício em vários chips menores, que são então encapsulados e utilizados separadamente; a Cerebras, ao contrário, projeta toda a pastilha de silício como um único chip gigante, integrando uma grande quantidade de unidades de processamento e memória nele.

Esse design reduz drasticamente a distância física entre processamento e memória, eliminando a necessidade de transferir dados entre múltiplos chips, o que diminui a complexidade do sistema e ajuda a aumentar a eficiência geral do processamento.

Cerebras foca em baixa latência, velocidade em inferência

No programa, foi destacado que o principal indicador na fase de inferência é a velocidade de resposta, o desempenho de latência e a estabilidade do sistema. Após o usuário enviar uma instrução, o modelo deve completar o cálculo e retornar o resultado imediatamente; qualquer atraso impacta diretamente a experiência do usuário.

Como a Cerebras concentra grande parte do poder de processamento e memória em um único chip gigante, os dados fluem por uma distância extremamente curta, tornando-se especialmente adequado para cenários de inferência que exigem respostas de alta frequência e baixa latência.

Foi mencionado que os primeiros a adotar amplamente o sistema Cerebras foram instituições do Oriente Médio, incluindo entidades relacionadas aos Emirados Árabes Unidos; após a implementação, eles demonstraram uma vantagem de velocidade significativa em tarefas específicas de inferência.

OpenAI diversifica cadeia de suprimentos para evitar riscos de fornecedores únicos

Os anfitriões apontaram que, nos últimos anos, a OpenAI adotou claramente uma estratégia de “múltiplos fornecedores”, deixando de depender exclusivamente de um único fabricante de chips.

Atualmente, a OpenAI utiliza em grande escala a capacidade da NVIDIA (NVIDIA) e também colabora com a AMD (AMD), além de agora incorporar a Cerebras, formando múltiplas linhas de fornecimento de poder de processamento. O objetivo é dispersar riscos e evitar que mudanças na capacidade, preço ou políticas de um único fornecedor afetem a estabilidade geral do serviço.

O programa descreveu isso como uma estratégia de “descentralização” na cadeia de fornecimento de capacidade de processamento, garantindo que, se uma rota apresentar problemas, o serviço continue ininterrupto.

Indústria de chips de silício passa por nova reorganização, novas startups também têm chance

Os anfitriões acreditam que essa cooperação não é apenas uma mudança de estratégia da OpenAI, mas também um símbolo de que a indústria de chips de IA está entrando em um novo ciclo de competição.

Nos próximos 10 a 20 anos, pode-se repetir o cenário de uma guerra de várias empresas no início da era dos computadores pessoais, onde não apenas grandes fabricantes de chips, mas também muitas novas equipes podem encontrar seu espaço na área de chips de inferência, processamento dedicado e chips para aplicações verticais.

Com a demanda por comercialização de IA em contínuo crescimento, desde que a direção tecnológica seja correta, pequenas startups ainda terão oportunidades de se destacar rapidamente na indústria.

Mudança de foco na indústria, de treinamento para inferência

Para concluir, o programa resumiu que, no início do desenvolvimento de IA, o mercado focava em quem treinava o maior e mais poderoso modelo; mas, à medida que as aplicações se concretizam, quem realmente decide o sucesso será aquele que oferece inferência mais rápida, com menor custo e maior estabilidade.

A parceria entre OpenAI e Cerebras é vista como um indicador importante dessa mudança na indústria, mostrando que a competição em IA está se deslocando progressivamente de “escala de treinamento” para “eficiência de inferência”.

(《All-In Podcast》previsão para 2026: IA, cobre e eletricidade se tornam os novos pilares da economia global)

Este artigo 《All-In Podcast》Mudança no campo de batalha da IA, reinício da guerra de chips de silício, novas startups também podem se destacar, foi originalmente publicado na ABMedia.

Ver original
Isenção de responsabilidade: As informações contidas nesta página podem ser provenientes de terceiros e não representam os pontos de vista ou opiniões da Gate. O conteúdo apresentado nesta página é apenas para referência e não constitui qualquer aconselhamento financeiro, de investimento ou jurídico. A Gate não garante a exatidão ou o carácter exaustivo das informações e não poderá ser responsabilizada por quaisquer perdas resultantes da utilização destas informações. Os investimentos em ativos virtuais implicam riscos elevados e estão sujeitos a uma volatilidade de preços significativa. Pode perder todo o seu capital investido. Compreenda plenamente os riscos relevantes e tome decisões prudentes com base na sua própria situação financeira e tolerância ao risco. Para mais informações, consulte a Isenção de responsabilidade.
Comentar
0/400
Nenhum comentário