Gate News 訊息,4 月 25 日 — 隨著微軟與亞馬遜等主要雲端服務供應商將運算產能集中用於內部團隊與像 OpenAI、Anthropic 這樣的重大客戶,GPU 供應短缺再次浮現;這使較小型的 AI 新創面臨價格上漲、等待時間延長,以及更嚴格的合約條款。微軟 Azure 的銷售管理部門已告知員工,雲端客戶的 GPU 等待時間預計將持續到 2026 年底。
影像生成新創 Krea 曾從包含 Andreessen Horowitz 與 Bain Capital Ventures 在內的投資者募集 $83 million,先前透過為期六個月的合約,以每小時 $2.80 的價格租用數百顆 Blackwell 晶片。續約時,多家雲端服務供應商對詢問不再回覆;Krea 最終以每小時 $3.70 的價格取得晶片,漲幅為 32%,且合約延長至一年。執行長 Victor Perez 指出,部分供應商只是沒有回應,而另一些則堅持在談判前需先做多年度承諾。GPU 雲端供應商 Lightning AI 的執行長 Will Falcon 表示,公司目前線上運作 40,000 顆 GPU,但約有 40 位排隊客戶合計需要 400,000 顆 GPU;在短短六個月內,租用價格上漲超過 25%。
微軟已實施分級的 GPU 存取管理:約 1,000 位最大客戶 (Tier 1) 取得優先配額;而尋求 Blackwell 晶片的較小客戶則必須承諾至少 1,000 單位,且最短為一年,合約起步為數千萬美元。採即用即付(Pay-as-you-go)的客戶若設備閒置數小時,可能面臨失去 GPU 存取權。參與微軟 for Startups 免費層(free-tier)方案的創業團隊也已被警告:若 GPU 利用率不足,可能導致存取權被撤銷。
風險投資公司 General Catalyst 正在調查其投資組合公司在運算瓶頸方面的情況,並考慮建立共享 GPU 池,或採取集體談判策略。部分新創正在考慮直接採購 GPU 以繞過排隊:石油產業 AI 新創 Collide 計畫投入約 $500,000 於 Nvidia GPU,並租用資料中心空間以獨立運作、避免不確定性。