門戶新聞訊息,4月27日——DeepSeek 推遲了其 V4 模型的發布,以微調其軟體堆疊來適配華為的 Ascend 晶片,反映北京更廣泛的舉措:在取得先進外國半導體的途徑日益受限之際,打造本土 AI 供應鏈。
DeepSeek 的 V4-Pro 模型在主要測試中的表現,符合 OpenAI 和 Anthropic 制定的基準,同時以顯著更低的 API 成本脫穎而出:每百萬輸入 token 價格為 $1.74,相較於西方競爭者更具成本優勢。該公司表示,V4-Pro 相較其 V3.2 前代,在計算效率上提升了 27%,並在 100 萬 token 的情境中使用了大幅更少的運算能力。DeepSeek 先前已透過其 R1 模型展現成本效率,公司稱該模型的開發成本低於 $6 million。
市場反應體現了採用國產晶片的轉變。中國 AI 公司 MiniMax 與 Zhipu (Knowledge Atlas Technology) 的股價各自約下跌 8%,而晶片製造商則受益:中國最大的代工晶片製造商中芯國際(SMIC)上漲 9%,華虹半導體(Hua Hong Semiconductor)攀升 15%。
然而,DeepSeek 的技術報告顯示,公司仍部分依賴 Nvidia 晶片。目前中國半導體可承擔模型推論,但只有 V4 訓練的部分內容似乎已針對本土硬體進行了調整;報告並未釐清 Nvidia 晶片是否執行了模型訓練階段的大部分工作。