🚨 A CRISE DE RAM ACABOU DE TERMINAR E UM ALGORITMO A RESOLVEU


Em outubro de 2025, a OpenAI voou para Seul.
Eles assinaram acordos com Samsung e SK Hynix.
Para 900.000 wafers de memória. Por mês.
Isso representa 40% de toda a oferta mundial de DRAM.
Reservado. Para uma única empresa.
Conjuntos de RAM DDR5 passaram de $120 para $490 quase da noite para o dia.
Portáteis ficaram mais caros.
Telefones vieram com menos RAM.
Construtores de PCs estavam pagando 4 vezes mais do que no ano anterior.
Analistas chamaram de pior crise de memória em 20 anos.
Então a Google publicou um artigo de pesquisa.
Aqui está por que isso importa.
Cada chatbot de IA que você usa tem uma "memória de trabalho".
Chama-se cache KV.
É assim que o modelo lembra da sua conversa enquanto você fala.
Ela é armazenada com precisão de 16 bits.
É como escrever cada palavra em letras gigantes e negrito.
É preciso. Mas é enorme.
E à medida que as janelas de contexto de IA cresceram para 1 milhão de tokens, essa memória inchou.
Centros de dados estavam acumulando RAM só para acompanhar.
A equipe do Google fez uma pergunta diferente.
Ela realmente precisa ser tão grande?
A resposta foi não.
Eles desenvolveram o TurboQuant.
Usando matemática de coordenadas polares e a transformação Johnson-Lindenstrauss, eles comprimiram essa memória de 16 bits para 3.
Sem necessidade de retreinamento.
Sem perda de precisão.
6x menos memória.
8x mais rápido em Nvidia H100s.
O artigo foi publicado em 25 de março de 2026.
As ações de chips de memória caíram em 24 horas.
E então aconteceu algo mais.
A OpenAI já estava sob pressão.
Investidores queriam cortes de custos.
Uma potencial IPO estava no horizonte.
Eles cancelaram um grande acordo de data center com a Oracle no Texas.
Eles encerraram a Sora.
Eles reduziram silenciosamente seus pedidos de RAM da Samsung e SK Hynix.
Os kits DDR5 caíram $100 em semanas.
A crise de RAM começou a se desfazer quase da noite para o dia.
Aqui está a verdadeira lição.
A escassez não foi um problema de hardware.
Foi uma aposta.
Uma aposta de que a IA sempre seria faminta por memória.
Que a única solução era comprar mais chips.
O TurboQuant invalidou essa aposta na camada de software.
De graça.
Um artigo de pesquisa mudou a economia de toda uma indústria.
É assim que a eficiência algorítmica se apresenta como uma força macro.
E ainda estamos apenas começando.
Ver original
post-image
post-image
Esta página pode conter conteúdo de terceiros, que é fornecido apenas para fins informativos (não para representações/garantias) e não deve ser considerada como um endosso de suas opiniões pela Gate nem como aconselhamento financeiro ou profissional. Consulte a Isenção de responsabilidade para obter detalhes.
  • Recompensa
  • Comentário
  • Repostar
  • Compartilhar
Comentário
Adicionar um comentário
Adicionar um comentário
Sem comentários
  • Marcar