根據 Bloomberg 深度報導與 Google 官方公告,Google 於 4 月 22 日正式擴張自研 AI 晶片陣容:推理專用 Ironwood(第七代 TPU)在 Google Cloud 全面供應,並同步啟動與 Broadcom、MediaTek、Marvell、Intel 四家夥伴的下世代設計合作,目標是以客製晶片供應鏈正面挑戰 Nvidia 在 AI 算力市場的主導地位。
Ironwood:第七代 TPU,首度專為推理設計
Ironwood 是 Google TPU 系列第七代產品,也是首款「訓練推理分流」策略下的推理專用晶片。Google 揭露的規格:單晶片尖峰效能為 TPU v5p 的 10 倍,配置 192GB HBM3E 記憶體、記憶體頻寬達 7.2 TB/s,單個 superpod 可擴展至 9,216 顆液冷 Ironwood,合計 FP8 運算量達 42.5 exaflops。
Google 官方表示 Ironwood 已「全面開放 Google Cloud 客戶使用」,今年出貨量預計達「百萬顆」等級。Anthropic 已承諾採用多達 100 萬顆 Ironwood TPU,Meta 則簽署「數十億美元多年合約」透過 Google Cloud 使用 TPU。
四家夥伴分工:訓練歸 Broadcom、推理歸 MediaTek
Google 下世代晶片供應鏈明確分工如下:
夥伴 代號 角色 特色 Broadcom Sunfish 訓練專用 延續既有 TPU 合作關係,主導大型訓練節點 MediaTek(聯發科) Zebrafish 推理專用 宣稱比 Broadcom 方案成本低 20–30% Marvell 談判中 記憶體處理單元(MPU)+ 額外推理 TPU 為 HBM 與 inference 優化 Intel 未公開 參與設計 強化供應鏈分散
這是 AI 產業中首見的「四家夥伴並行、訓練推理明確分工」模式。Google 透過分散 IP 風險與競爭議價,避開 Nvidia 單一供應商的結構依賴。路線圖延伸至 2027 年底的 TPU v8,將於台積電 2nm 製程生產。
策略意義:挑戰 Nvidia 的不是單晶片,而是供應鏈
過去三年 AI 晶片市場由 Nvidia 近乎壟斷,CUDA 軟體生態與 H100/GB200 晶片構成雙重護城河。Google 的 Ironwood 與四夥伴策略並非以「單點規格超越」為目標,而是複製 Nvidia 在產業中的「標準化平台 + 多客戶採購」邏輯——讓 TPU 不只是 Google 自用,而是可被 Anthropic、Meta 等主要 AI 公司共用的商業化算力選項。
Anthropic 承諾 100 萬顆 TPU 的意義尤其關鍵:這是 Nvidia 以外單家 AI 公司最大算力承諾,與 Anthropic 4/20 與 Amazon 達成 5GW/1000 億 AWS 承諾形成互補——一邊綁定 AWS Trainium、一邊綁定 Google TPU,Anthropic 以「雙客製晶片」策略降低 Nvidia 依賴。Meta 則是首次公開將 TPU 納入自家 AI 訓練/推理工作負載,形成另一道訊號。
市場反應與產業連動
聯發科在此次揭露前已被視為「Google 客製晶片受益者」,Zebrafish 代號的曝光是首度將聯發科直接列為 Google 推理晶片設計夥伴。這延伸近期 AMD × GlobalFoundries 矽光子、Marvell × Google MPU 的「非 Nvidia 晶片聯盟」敘事線。
Nvidia 於同期仍有 GB200 與下世代 Rubin 平台支撐,但客戶端的算力組合正從「全 Nvidia」走向「Nvidia + TPU + AWS Trainium」的三軌並行。這對台積電 2nm 產能也意味著 Google、Nvidia、Apple、Amazon 四大客戶都在排隊,晶圓代工供應議價力持續上升。
這篇文章 Google Ironwood TPU:10 倍效能 + 四家夥伴對抗 Nvidia 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
OpenAI 發布開源隱私過濾器模型,用於偵測與遮蔽 PII
摘要:OpenAI 的隱私過濾器(Privacy Filter)是一個開源、可在本機執行的模型,用於偵測並遮蔽文字中的個人可識別資訊(PII)。它支援大型上下文,能辨識多種 PII 類別,並用於以隱私保護為導向的工作流程,例如資料準備、索引、記錄(logging)與內容審查(moderation)。
OpenAI 的隱私過濾器是一個在本機運行的開源模型 (128k-token context),可偵測並遮蔽文字中的 PII,涵蓋隱私工作流程所需的聯絡、金融與憑證資料。
GateNews2分鐘前
OpenAI 計劃在 2030 年前部署 30GW 的運算能力
OpenAI 目標在 2030 年前達到 30GW 的運算能力,以滿足日益增長的 AI 需求;其中 10GW 的 2025 年目標已完成 8GW。這次擴張顯示出一項策略,即擴大基礎設施規模,以支援下一代 AI 的開發與部署。
OpenAI 打算在 2030 年前達到 30GW 的運算能力,以因應不斷成長的 AI 需求;目前已完成 10GW、2025 年目標中的 8GW。此舉反映了 OpenAI 為支援下一代 AI 的開發與部署而進行的基礎設施策略性擴張。
GateNews3分鐘前
360 AI 漏洞發現代理發現近 1,000 個零日漏洞,與 Mythos 展開競爭
360 Digital Security 以 AI 驅動的代理聲稱已發現約 1,000 個新的漏洞,其中包括 Office 與 OpenClaw;AI 如今已成為發現與利用鏈準備的核心,與 Mythos 不相上下。
摘要:一份被《彭博社》引述的報告指出,360 Digital Security Group 的 AI 驅動漏洞發現代理在近幾個月內已辨識出近 1,000 個先前未知的漏洞,其中包括在 Microsoft Office 與 OpenClaw 框架中。該公司表示,AI 已成為漏洞發現的核心引擎,並宣布了一款 AI 工具以加速利用鏈的構建。Benincasa 依據 Natto Thoughts 對該公司中文公告的審閱,將 360 描述為 Anthropic 的 Mythos 競爭者。
GateNews8分鐘前
Yifan Zhang 揭露 DeepSeek V4 完整技術規格:1.6T 參數、384 位專家(6 次啟用)
Gate News 訊息,4 月 22 日——普林斯頓博士生 Yifan Zhang 在 X 上披露 DeepSeek V4 的完整技術規格,該內容在 4 月 19 日的預告之後發布。V4 具備 1.6 兆(1.6 trillion)總參數,並有輕量版本 V4-Lite,其參數為 2850 億(285 billion)。
該模型採用 DSA2
GateNews1小時前
Anthropic CEO 赴白宮破冰:與幕僚長、貝森特會商 Mythos
華爾街日報稱,Anthropic CEO Amodei 4/17 白宮密會,聚焦 Mythos 的國安邊界與負責任部署;白宮稱會議具建設性,市場視為關係解凍。核心分歧是軍方要 Claude 一切合法用途,Anthropic 堅持自家可接受使用政策裁量。雙方均表示將持續對話,5月 Mythos 上線前再談。
鏈新聞abmedia2小時前
DeepSeek 洽談首輪外部融資、估值 200 億美元:中國 AI 估值新高
根據 Bloomberg 4 月 22 日報導(引 The Information 獨家),中國 AI 新創 DeepSeek 正洽談首輪外部融資,估值達 200 億美元。這是 DeepSeek 自 2023 年成立以來首次對外募資,過去完全由量化對沖基金 High-Flyer Capital Management 內部供資。200 億美元估值也是中國 AI 新創首度進入「百億美金估值」下半段的里程碑。
融資規模與資金用途
DeepSeek 尋求至少 3 億美元的首輪融資,200 億美元估值較稍早 4 月 17 日 The Information 初次披露的「100 億美元以上」估值再翻倍
鏈新聞abmedia2小時前