Gate News, Meldung vom 22. April — Google Cloud hat die Veröffentlichung seiner kundenspezifisch gebauten TPU (Tensor Processing Unit)-Chips der achten Generation am 22. April angekündigt. Die neue Produktlinie umfasst TPU 8t, die speziell für KI-Trainingsaufgaben entwickelt wurde, sowie TPU 8i, das für KI-Inferenz-Workloads optimiert ist. Beide Chips werden später in diesem Jahr verfügbar sein. Google hat außerdem neue Tools vorgestellt, um KI-Agenten zu bauen, und einen $750 Millionen-Fonds angekündigt, um die Einführung von Enterprise-KI voranzutreiben.
TPU 8t liefert 2,8-mal die Leistung der vorherigen Generation von Googles Ironwood-TPU zum gleichen Preisniveau. TPU 8i steigert die Leistung um 80% gegenüber dem Vorgänger und integriert eine statische Random-Access-Memory (SRAM)-Architektur, um „kosteneffizienten Durchsatz in großem Maßstab und geringe Latenz zu ermöglichen und damit zu erreichen, dass Millionen von Agenten gleichzeitig laufen können“, so CEO Sundar Pichai. Im Vergleich zu Ironwood erreichen beide TPU 8t und TPU 8i eine mehr als doppelt so hohe Energieeffizienz pro Watt: TPU 8t verbessert sich um 124% und TPU 8i um 117%. Google hat die Energieeffizienz über den gesamten Technologiestapel hinweg optimiert und integrierte dynamische Energiemanagementsysteme, die den Verbrauch anhand der aktuellen Nachfrage anpassen.
Googles eigene Modelle verarbeiten jetzt über 160 Milliarden Tokens pro Minute über direkte Kunden-API-Aufrufe, nach 100 Milliarden im letzten Quartal. KI erzeugt nun 75% sämtlichen neuen Codes bei Google, verglichen mit 50% im Herbst des vergangenen Jahres. Gemini Enterprise, Googles Angebot für Unternehmen, wuchs um 40% im Quartalsvergleich bei den bezahlten monatlich aktiven Nutzern. Das Unternehmen erwartet, bis 2026 etwas mehr als die Hälfte seines Machine-Learning-Compute-Budgets in Cloud-Dienste zu investieren, um Cloud-Kunden und -Partner besser zu bedienen. Google erweitert zudem seine Zusammenarbeit mit Broadcom, um kundenspezifische TPU-Chips für künftige Generationen zu entwickeln und bereitzustellen, während große Technologiefirmen nach Alternativen zu den teuren und lieferengpassbedingten GPUs von NVIDIA und AMD suchen.