打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲?

鏈新聞abmedia

AI 浪潮推動記憶體需求與價格水漲船高,然而外界仍擔憂 HBM 是否會重蹈「週期性」覆徹,像過去的 DRAM 一樣,在需求高峰後迅速反轉?半導體架構分析人士 fin 對此指出,HBM 的需求邏輯,已與傳統記憶體產業規律脫鉤,正透過 token 重新定價。

(記憶體漲勢趨緩?機構評估 Q2 漲幅縮窄至 30%,下半年進一步降溫)

CPU 時代的記憶體:可有可無的附屬品

fin 指出,在 CPU 主導運算的年代,DDR 記憶體的角色始終只是輔助角色。CPU 工程師發展出一整套掩蓋記憶體延遲的架構技巧,包括超純量設計、多層快取、暫存器重新命名等,讓處理器得以在不倚賴高速記憶體的條件下維持高效能:

工業界的經驗法則是,即便 DDR 頻寬直接翻倍,CPU 整體效能的提升也往往不超過兩成。

這樣的架構直接塑造了過去數十年 DRAM 產業的成長節奏。DDR3 到 DDR5,歷時整整十五年;過去十年間,一般 PC 的 DDR 容量從 7 至 8 GB 增長至約 23 GB,十年僅成長三倍。DRAM 廠商的主要獲利來源為容量大小,頻寬升級不過是拉高單位售價的手段。

在 CPU 時代,記憶體就是晶片產業裡邊際效用最低的一環,週期性起伏是常態、也是宿命。

AI 推理時代來臨,從根本改寫記憶體價值標準

然而,當運算主角切換至 AI 推理引擎,衡量標準也隨之更迭,晶片廠商比的是每秒能執行多少次浮點運算;如今,AI 時代的核心 KPI 只有一個:每單位成本與每單位功耗,能夠產生多少個 Token。

輝達執行長黃仁勳所提出的「AI 工廠」概念,精確描述了這套新邏輯:AI 工廠存在的意義,就是以最低成本生產最多 Token,同時把 Token 的輸出速度推向極限。優化目標由單一維度向外擴展,需同時最大化 Token 的總吞吐量,也追求每個請求的 Token 輸出速度。

這個 KPI 的改變,則成了 HBM 命運翻轉的起點。

Token 吞吐量公式,揭開 HBM 需求的第一性原理

fin 將 AI 推理的 Token 吞吐量,拆解為兩個參數的乘積:「同時處理的請求批次數量 × 每個請求的平均 Token 生成速度」追溯這兩個參數各自的瓶頸,答案都指向同一個零件。

批次數量的瓶頸,在於 HBM 的儲存容量。每一個推理請求都攜帶著自己的 KV 快取,也就是模型推理過程中儲存中間狀態的機制,而這份快取必須即時存放在 HBM 之中,以便模型每生成一個 Token 時反覆高速讀取。批次規模越大,HBM 所需的儲存空間就越大,兩者呈線性正比關係。

Token 速度的瓶頸,則在於 HBM 的頻寬。模型解碼階段每產生一個 Token,都需要反覆讀取龐大的啟動權重與 KV 快取,讀取速度直接決定了 Token 的生成效率,而讀取速度的上限,就是 HBM 的頻寬。

他表示,這個關係可以用機場接駁車做比喻:HBM 容量是接駁車的車廂大小,決定一次能載多少乘客;HBM 頻寬是車門的寬度,決定乘客上下車的速度;旅客輸送的總吞吐量,則是車廂大小乘以上車速度的積。由此推導出 AI 推理硬體需求的第一原則:

Token 吞吐量 = HBM 容量 × HBM 頻寬

若要讓每一代 GPU 的 Token 吞吐量維持兩倍的世代成長,HBM 容量與 HBM 頻寬的乘積就必須每代翻倍。

軟體優化解不了題,HBM 需求鎖定在指數軌道上

面對這套推論,市場最常見的反駁是:軟體優化難道不能降低對 HBM 的依賴?他給出的答案是,軟體效率與硬體規格的進步是兩個完全獨立的維度,兩者並不互相取代。這就像 CPU 軟體優化再徹底,仍無法阻止英特爾或 AMD 每一代都必須在標準測試中交出更高的跑分,否則產品就賣不出去。

GPU 的邏輯完全相同:只要全球對 Token 的需求持續擴張,對更高 Token 吞吐量的追求就不會停歇,對 HBM 兩方面進步的需求更不會停止。

更關鍵的是,這股壓力並非來自外部景氣的拉動,而是供應端的內生需求。只要輝達還要販賣下一代 GPU,就必然要向 SK 海力士、三星、美光施壓,要求每一代 HBM 在容量與頻寬上同步躍進,因為 HBM 的天花板,就是 GPU 效能的天花板。

將輝達從 A100 到 Rubin Ultra 各代 GPU 的 Token 吞吐量,與對應的「HBM 容量 × HBM 頻寬」數值繪於同一對數座標圖上,兩條曲線的吻合程度將令人驚訝。這並非歷史巧合,而是系統最佳化的必然解。

HBM 告別週期宿命,市場定價邏輯仍待重估

綜合上述架構層面的推導,HBM 與傳統 DRAM 的本質差異已然清晰。傳統記憶體是晶片產業的附屬品,需求驅動力薄弱,一旦擴產節奏超越需求復甦,週期性崩價便如期而至。

但 HBM 的需求,已被 AI 推理架構的物理邏輯鎖定在指數成長的軌道之上。這與 AI 整體市場的冷熱與總體經濟的景氣循環,都不存在直接的因果關係。

當然,真正的問題並不在需求端,而在供應端:SK 海力士、三星與美光這三大玩家,在面對強勁需求時,能否克制過去幾十年間反覆上演的盲目擴產衝動,避免再度埋下供過於求的週期禍根?這個問題的答案將會是本輪記憶體週期,能否長期延續的關鍵變數。

(記憶體股崩跌還能買嗎?三星證券分析師:週期內修正而非景氣見頂)

這篇文章 打破週期性迷思!一公式拆解 HBM 需求結構:記憶體為何只會繼續上漲? 最早出現於 鏈新聞 ABMedia。

免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見聲明

相關文章

比特幣 ETF 記錄 $603M 每日資金流入,而 Solana ETF 持續出現資金流出

Gate News 訊息,根據 5 月 4 日更新,比特幣 ETF 在 1 天內錄得 7,524 BTC 淨流入(約 6.0314 億美元),以及 7 天內錄得 1,487 BTC 淨流入(約 1.1921 億美元)。以太坊 ETF 則出現 1 天淨流入 41,739 ETH(約 9,892 萬美元),但經歷

GateNews14分鐘前

FINRA 核准 Securitize,作為首家完整堆疊鏈上 IPO 基礎設施供應商

根據 The Block,FINRA 已批准 Securitize 透過其經紀商-交易商子公司承銷代幣化 IPO,並託管代幣化證券。這使得 Securitize 成為首家獲得此類核准的公司,讓其能夠促成代幣化股票與穩定幣之間的原子式交割

GateNews14分鐘前

FINRA 核准 Securitize 作為首家全方位鏈上 IPO 承銷商與託管機構

根據 The Block,FINRA 已批准 Securitize 承銷代幣化 IPO 和次級發行,並透過其券商-交易商子公司提供代幣化證券的託管。這些核准使 Securitize 成為首家獲得如此全面的法規綠燈、可針對鏈上證券的公司

GateNews32分鐘前

TradFi 上漲提醒:CRCL(Circle Internet Group Inc)上漲超 14%

Gate News 消息,據 Gate TradFi 最新數據,CRCL(Circle Internet Group Inc)瞬時上漲 14%,當前波動幅度明顯高於近期平均水平,市場活躍度上升。

GateNews58分鐘前

加密貨幣專家分享完整的市場預測,聚焦 2026-2027 年 BTC 與 ETH 價格

加密貨幣專家分享完整的市場預測,著重於 BTC 與 ETH 的價格。 他預期加密貨幣與股票資產將在 2026 年第三季見底。 隨後將迎來 2027 年的看漲行情,讓 BTC 觸及 140,000 美元。 更早之前,

Crypto News Land1小時前
留言
0/400
暫無留言