DeepSeek 推遲 V4 上市以針對華為的 Ascend 晶片進行優化

門戶新聞訊息,4月27日——DeepSeek 推遲了其 V4 模型的發布,以微調其軟體堆疊來適配華為的 Ascend 晶片,反映北京更廣泛的舉措:在取得先進外國半導體的途徑日益受限之際,打造本土 AI 供應鏈。

DeepSeek 的 V4-Pro 模型在主要測試中的表現,符合 OpenAI 和 Anthropic 制定的基準,同時以顯著更低的 API 成本脫穎而出:每百萬輸入 token 價格為 $1.74,相較於西方競爭者更具成本優勢。該公司表示,V4-Pro 相較其 V3.2 前代,在計算效率上提升了 27%,並在 100 萬 token 的情境中使用了大幅更少的運算能力。DeepSeek 先前已透過其 R1 模型展現成本效率,公司稱該模型的開發成本低於 $6 million。

市場反應體現了採用國產晶片的轉變。中國 AI 公司 MiniMax 與 Zhipu (Knowledge Atlas Technology) 的股價各自約下跌 8%,而晶片製造商則受益:中國最大的代工晶片製造商中芯國際(SMIC)上漲 9%,華虹半導體(Hua Hong Semiconductor)攀升 15%。

然而,DeepSeek 的技術報告顯示,公司仍部分依賴 Nvidia 晶片。目前中國半導體可承擔模型推論,但只有 V4 訓練的部分內容似乎已針對本土硬體進行了調整;報告並未釐清 Nvidia 晶片是否執行了模型訓練階段的大部分工作。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0
GateUser-a9f74275vip
· 04-27 00:42
快上車!🚗
查看原文回復0