Gate News-Nachricht, 23. April — Google gab am 22. April bekannt, dass es noch in diesem Jahr separate TPU-Chips der achten Generation für Training und Inferenz veröffentlichen wird, um sein bisheriges kombiniertes Design zu ersetzen. Die Maßnahme zielt auf Workloads für KI-Agenten ab und bietet Kunden von Google Cloud eine Alternative zu der Hardware von Nvidia.
Der Trainingschip bietet bei gleichem Preis die 2,8-fache Leistung der Ironwood-TPU der siebten Generation von Google, während der Inferenzchip 80% schneller ist und 384 MB SRAM bietet, also das Dreifache im Vergleich zu Ironwood. Die Trennung der Fähigkeiten für Training und Inferenz spiegelt eine veränderte Herangehensweise wider, wie Unternehmen für unterschiedliche Rechenanforderungen optimieren.
Die Initiative wird durch eine langfristige Partnerschaft mit Broadcom und Anthropic gestützt. Anthropic plant, ab 2027 über Broadcom etwa 3,5 Gigawatt an TPU-Computing zu nutzen, wobei Broadcom bis 2031 die Chipfertigung sowie die Netzwerkkomponenten übernimmt. Anthropic, das KI-Startup hinter Claude, hat zuletzt einen annualisierten Umsatz gesehen, der $30 Milliarden überstieg. In der Zwischenzeit erweitern auch Apple, Microsoft, Meta und Amazon ihre Initiativen für maßgeschneiderte KI-Chips, um die Abhängigkeit von Nvidia zu verringern, das weiterhin Marktführer ist.