Google Ironwood TPU:10x Leistung + vier Partner im Kampf gegen Nvidia

ChainNewsAbmedia

Laut einem ausführlichen Bericht von Bloomberg und offiziellen Ankündigungen von Google hat Google am 22. April offiziell sein Portfolio eigener KI-Chips erweitert: Der für Inferenz optimierte Ironwood (siebte Generation TPU) wird bei Google Cloud vollständig bereitgestellt, und gleichzeitig werden die Next-Generation-Design-Kooperationen mit den vier Partnern Broadcom, MediaTek, Marvell und Intel gestartet. Ziel ist es, die Vorherrschaft von Nvidia im Markt für KI-Rechenleistung mit einer kundenspezifischen Chip-Lieferkette positiv herauszufordern.

Ironwood: 7. Generation TPU, erstmals speziell für Inferenz entwickelt

Ironwood ist Googles siebte Generation innerhalb der TPU-Serie und der erste Chip, der im Rahmen der Strategie „Training-Inferenz-Aufteilung“ speziell für Inferenz ausgelegt ist. Die von Google offengelegten Spezifikationen: Die Peak-Leistung pro Chip beträgt das 10-fache der TPU v5p, mit 192GB HBM3E-Speicher, einer Speicherbandbreite von 7,2 TB/s; ein einzelnes superpod kann bis zu 9.216 Flüssigkühl-„Ironwood“-Einheiten skalieren, und die gesamte FP8-Rechenleistung erreicht 42,5 exaflops.

Googles offizieller Aussage zufolge ist Ironwood bereits „für Google-Cloud-Kunden vollständig freigegeben“ zur Nutzung. In diesem Jahr wird erwartet, dass die Auslieferungsmenge „im Bereich von einer Million Chips“ liegen wird. Anthropic hat zugesagt, bis zu 1 Million Ironwood-TPUs zu verwenden; Meta hingegen hat einen „Mehrjahresvertrag im Wert von mehreren Milliarden US-Dollar“ unterzeichnet, um TPU über Google Cloud zu nutzen.

Aufgabenverteilung der vier Partner: Training zu Broadcom, Inferenz zu MediaTek

Die Next-Generation-Chip-Lieferkette von Google ist wie folgt klar aufgeteilt:

Partner Kennung Rolle Besonderheiten Broadcom Sunfish Training, exklusiv Dafür sind Schulungen vorgesehen Verlängert die bestehende TPU-Kooperationsbeziehung, treibt große Trainingsknoten an MediaTek (联发科) Zebrafish Inferenz, exklusiv Behauptet, dass es bei den Kosten im Vergleich zum Broadcom-Ansatz um 20–30% niedriger ist Marvell Im Verhandlungsprozess Speicherverarbeitungseinheit (MPU) + zusätzliche Inferenz-TPU Für HBM- und Inferenz-Optimierung Intel Nicht öffentlich an der Entwicklung beteiligt Stärkt die Diversifizierung der Lieferkette

Dies ist das erste Muster in der KI-Branche: „Vier-Partner parallel, klare Aufteilung zwischen Training und Inferenz“. Google umgeht die strukturelle Abhängigkeit von Nvidia als einziger Lieferant, indem es IP-Risiken verteilt und harte Preisverhandlungen (Wettbewerbsdruck) nutzt. Der Fahrplan reicht bis Ende 2027 für die TPU v8; produziert wird sie im 2-nm-Verfahren bei TSMC.

Bedeutung der Strategie: Nicht der einzelne Chip ist die Herausforderung für Nvidia, sondern die Lieferkette

In den vergangenen drei Jahren war der Markt für KI-Chips nahezu von Nvidia monopolisiert. Die doppelte Burggraben bilden die CUDA-Software-Ökologie und die H100-/GB200-Chips. Die Ironwood- und Vier-Partner-Strategie von Google verfolgt nicht das Ziel, mit „einer einzelnen Spezifikation“ Nvidia zu übertreffen. Stattdessen kopiert sie die in der Industrie etablierte Logik von Nvidia: „Standardisierte Plattform + Einkauf durch mehrere Kunden“ – damit TPU nicht nur für Google selbst genutzt wird, sondern als kommerzielle Option für gemeinsam nutzbare Rechenleistung für führende KI-Unternehmen wie Anthropic und Meta dient.

Die Bedeutung des Versprechens von Anthropic über 1 Million TPU ist besonders entscheidend: Es ist das größte Rechenleistungsversprechen einer einzelnen KI-Firma außerhalb von Nvidia. In Kombination mit den Ergänzungen rund um Anthropic (4/20) und Amazons 5GW-/100-Milliarden-AWS-Zusage entsteht ein komplementäres Gesamtbild: Einerseits bindet sich Anthropic an AWS Trainium, andererseits bindet es sich an Googles TPU. Mit der „Dual-Custom-Chip“-Strategie reduziert Anthropic die Abhängigkeit von Nvidia. Meta ist zugleich das erste Unternehmen, das TPU öffentlich in seine eigenen KI-Trainings-/Inferenz-Workloads einbezieht, was ein weiteres Signal setzt.

Marktreaktion und Branchenverknüpfung

MediaTek gilt bereits vor dieser Offenlegung als „Begünstigter von Googles kundenspezifischen Chips“. Die Enthüllung des Zebrafish-Codes ist das erste Mal, dass MediaTek direkt als Design-Partner für Googles Inferenz-Chips genannt wird. Diese Entwicklung knüpft an die jüngste Narrative-Linie der „Nicht-Nvidia-Chip-Allianz“ an: die AMD × GlobalFoundries Silizium-Photonik sowie Marvell × Google MPU.

Nvidia erhält zwar im selben Zeitraum weiter Unterstützung durch GB200 und die Next-Generation-Rubin-Plattform, doch beim Kundenmix verschiebt sich die Rechenleistung zunehmend von „alles Nvidia“ hin zu „Nvidia + TPU + AWS Trainium“ als parallelem Drei-Schienen-Modell. Das bedeutet auch für die 2-nm-Kapazitäten von TSMC: Google, Nvidia, Apple und Amazon reihen sich allesamt ein, wodurch die Verhandlungsmacht bei der Auftragsfertigung (Wafer-Fab) weiter steigt.

Der früheste Ort, an dem dieser Artikel zu Google Ironwood TPU: „10-fache Leistung + Vier-Partner im Kampf gegen Nvidia“ erschien, war 链新闻 ABMedia.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare