Laut einem ausführlichen Bericht von Bloomberg und offiziellen Ankündigungen von Google hat Google am 22. April offiziell sein Portfolio eigener KI-Chips erweitert: Der für Inferenz optimierte Ironwood (siebte Generation TPU) wird bei Google Cloud vollständig bereitgestellt, und gleichzeitig werden die Next-Generation-Design-Kooperationen mit den vier Partnern Broadcom, MediaTek, Marvell und Intel gestartet. Ziel ist es, die Vorherrschaft von Nvidia im Markt für KI-Rechenleistung mit einer kundenspezifischen Chip-Lieferkette positiv herauszufordern.
Ironwood: 7. Generation TPU, erstmals speziell für Inferenz entwickelt
Ironwood ist Googles siebte Generation innerhalb der TPU-Serie und der erste Chip, der im Rahmen der Strategie „Training-Inferenz-Aufteilung“ speziell für Inferenz ausgelegt ist. Die von Google offengelegten Spezifikationen: Die Peak-Leistung pro Chip beträgt das 10-fache der TPU v5p, mit 192GB HBM3E-Speicher, einer Speicherbandbreite von 7,2 TB/s; ein einzelnes superpod kann bis zu 9.216 Flüssigkühl-„Ironwood“-Einheiten skalieren, und die gesamte FP8-Rechenleistung erreicht 42,5 exaflops.
Googles offizieller Aussage zufolge ist Ironwood bereits „für Google-Cloud-Kunden vollständig freigegeben“ zur Nutzung. In diesem Jahr wird erwartet, dass die Auslieferungsmenge „im Bereich von einer Million Chips“ liegen wird. Anthropic hat zugesagt, bis zu 1 Million Ironwood-TPUs zu verwenden; Meta hingegen hat einen „Mehrjahresvertrag im Wert von mehreren Milliarden US-Dollar“ unterzeichnet, um TPU über Google Cloud zu nutzen.
Aufgabenverteilung der vier Partner: Training zu Broadcom, Inferenz zu MediaTek
Die Next-Generation-Chip-Lieferkette von Google ist wie folgt klar aufgeteilt:
Partner Kennung Rolle Besonderheiten Broadcom Sunfish Training, exklusiv Dafür sind Schulungen vorgesehen Verlängert die bestehende TPU-Kooperationsbeziehung, treibt große Trainingsknoten an MediaTek (联发科) Zebrafish Inferenz, exklusiv Behauptet, dass es bei den Kosten im Vergleich zum Broadcom-Ansatz um 20–30% niedriger ist Marvell Im Verhandlungsprozess Speicherverarbeitungseinheit (MPU) + zusätzliche Inferenz-TPU Für HBM- und Inferenz-Optimierung Intel Nicht öffentlich an der Entwicklung beteiligt Stärkt die Diversifizierung der Lieferkette
Dies ist das erste Muster in der KI-Branche: „Vier-Partner parallel, klare Aufteilung zwischen Training und Inferenz“. Google umgeht die strukturelle Abhängigkeit von Nvidia als einziger Lieferant, indem es IP-Risiken verteilt und harte Preisverhandlungen (Wettbewerbsdruck) nutzt. Der Fahrplan reicht bis Ende 2027 für die TPU v8; produziert wird sie im 2-nm-Verfahren bei TSMC.
Bedeutung der Strategie: Nicht der einzelne Chip ist die Herausforderung für Nvidia, sondern die Lieferkette
In den vergangenen drei Jahren war der Markt für KI-Chips nahezu von Nvidia monopolisiert. Die doppelte Burggraben bilden die CUDA-Software-Ökologie und die H100-/GB200-Chips. Die Ironwood- und Vier-Partner-Strategie von Google verfolgt nicht das Ziel, mit „einer einzelnen Spezifikation“ Nvidia zu übertreffen. Stattdessen kopiert sie die in der Industrie etablierte Logik von Nvidia: „Standardisierte Plattform + Einkauf durch mehrere Kunden“ – damit TPU nicht nur für Google selbst genutzt wird, sondern als kommerzielle Option für gemeinsam nutzbare Rechenleistung für führende KI-Unternehmen wie Anthropic und Meta dient.
Die Bedeutung des Versprechens von Anthropic über 1 Million TPU ist besonders entscheidend: Es ist das größte Rechenleistungsversprechen einer einzelnen KI-Firma außerhalb von Nvidia. In Kombination mit den Ergänzungen rund um Anthropic (4/20) und Amazons 5GW-/100-Milliarden-AWS-Zusage entsteht ein komplementäres Gesamtbild: Einerseits bindet sich Anthropic an AWS Trainium, andererseits bindet es sich an Googles TPU. Mit der „Dual-Custom-Chip“-Strategie reduziert Anthropic die Abhängigkeit von Nvidia. Meta ist zugleich das erste Unternehmen, das TPU öffentlich in seine eigenen KI-Trainings-/Inferenz-Workloads einbezieht, was ein weiteres Signal setzt.
Marktreaktion und Branchenverknüpfung
MediaTek gilt bereits vor dieser Offenlegung als „Begünstigter von Googles kundenspezifischen Chips“. Die Enthüllung des Zebrafish-Codes ist das erste Mal, dass MediaTek direkt als Design-Partner für Googles Inferenz-Chips genannt wird. Diese Entwicklung knüpft an die jüngste Narrative-Linie der „Nicht-Nvidia-Chip-Allianz“ an: die AMD × GlobalFoundries Silizium-Photonik sowie Marvell × Google MPU.
Nvidia erhält zwar im selben Zeitraum weiter Unterstützung durch GB200 und die Next-Generation-Rubin-Plattform, doch beim Kundenmix verschiebt sich die Rechenleistung zunehmend von „alles Nvidia“ hin zu „Nvidia + TPU + AWS Trainium“ als parallelem Drei-Schienen-Modell. Das bedeutet auch für die 2-nm-Kapazitäten von TSMC: Google, Nvidia, Apple und Amazon reihen sich allesamt ein, wodurch die Verhandlungsmacht bei der Auftragsfertigung (Wafer-Fab) weiter steigt.
Der früheste Ort, an dem dieser Artikel zu Google Ironwood TPU: „10-fache Leistung + Vier-Partner im Kampf gegen Nvidia“ erschien, war 链新闻 ABMedia.