Mensagem do Gate News, 22 de Abril — A Google Cloud anunciou a disponibilização dos seus chips TPU (Tensor Processing Unit) personalizados de oitava geração, a 22 de Abril. A nova gama inclui o TPU 8t, concebido especificamente para tarefas de treino de IA, e o TPU 8i, optimizado para cargas de trabalho de inferência de IA. Ambos os chips ficarão disponíveis mais tarde este ano. A Google também revelou novas ferramentas para criar agentes de IA e anunciou um fundo de $750 milhões para impulsionar a adopção de IA nas empresas.
O TPU 8t oferece 2,8 vezes o desempenho do TPU Ironwood da geração anterior da Google, no mesmo patamar de preço. O TPU 8i melhora o desempenho em 80% face ao seu antecessor e incorpora uma arquitectura de memória estática de acesso aleatório (SRAM) para proporcionar "transferência em grande escala com custo-efectivo e baixa latência, permitindo que milhões de agentes corram em simultâneo", segundo o CEO Sundar Pichai. Em comparação com o Ironwood, tanto o TPU 8t como o TPU 8i atingem uma eficiência superior a dobrar por watt, com o TPU 8t a melhorar 124% e o TPU 8i a melhorar 117%. A Google optimizou a eficiência energética em toda a pilha tecnológica e integrou sistemas de gestão de potência dinâmica que ajustam o consumo com base na procura em tempo real.
Os modelos de primeira parte da Google processam agora mais de 160 mil milhões de tokens por minuto através de chamadas directas de API dos clientes, acima dos 100 mil milhões no trimestre passado. A IA passa agora a gerar 75% de todo o novo código na Google, em comparação com 50% no outono do ano passado. O Gemini Enterprise, a oferta empresarial da Google, cresceu 40% em cadeia, no trimestre, em utilizadores mensais activos pagantes. A empresa espera investir ligeiramente mais de metade do seu orçamento de computação de aprendizagem automática em serviços na nuvem até 2026, para servir melhor clientes e parceiros na nuvem. A Google está também a alargar a sua colaboração com a Broadcom para desenvolver e fornecer chips TPU personalizados para futuras gerações, à medida que grandes empresas tecnológicas procuram alternativas às GPUs caras e com fornecimento limitado da NVIDIA e da AMD.