DeepSeek 以 98% 低於 OpenAI 的 GPT-5.5 Pro 成本發布 V4-Pro 與 V4-Flash 模型

Gate News 消息,4 月 25 日——DeepSeek 於 4 月 24 日發布 V4-Pro 與 V4-Flash 的預覽版本;兩者皆為開放權重模型,擁有一百萬 token 的上下文視窗。V4-Pro 具備 1.6 兆的總參數,但在每次推論時僅啟用 490 億參數,並採用 Mixture-of-Experts 架構。V4-Flash 具備 2,840 億的總參數,其中啟用 130 億。

定價顯著低於競品:V4-Pro 的每百萬輸入 token 成本為 $1.74,每百萬輸出 token 成本為 $3.48——約比 OpenAI 的 GPT-5.5 Pro 低 98% ($30 input,$180 output);且其成本約為 Claude Opus 4.7 的 五十分之一。V4-Flash 的價格為每百萬 token 輸入 $0.14、輸出 $0.28。兩款模型均以 MIT 授權開源,且可在本地免費運行。

DeepSeek 透過兩種新的注意力機制實現效率提升:Compressed Sparse Attention 與 Heavily Compressed Attention,將計算成本降低至 V4-Pro 前代機型的 27% (V3.2),以及將 V4-Flash 降至 10%。該公司在部分 V4 訓練中使用了華為 Ascend 晶片,繞過了美國對先進 Nvidia 處理器的出口限制。DeepSeek 表示,待 2026 年下半年新增 950 個新超節點啟動後,定價還將進一步下調。

在效能基準測試中,V4-Pro-Max 在 Codeforces 競賽程式設計 (3,206 分排名第一,位於人類參賽者中的約第 23 名),並在 Apex Shortlist 數學題上取得 90.2% 的分數,而 Claude Opus 4.6 為 85.9%。然而,它在多任務基準上表現落後:MMLU-Pro (87.5% 對比 Gemini-3.1-Pro 的 91.0%),以及 Humanity's Last Exam (37.7% 對比 44.4%)。在長上下文任務上,V4-Pro 領先開源模型,但在 MRCR 檢索測試中落後於 Claude Opus 4.6。

V4-Pro 引入“interleaved thinking(交錯式思考)”,使代理工作流程能在多次工具呼叫之間保留推理上下文,而無需在步驟之間刷新。兩款模型均支援與 Claude Code 與 OpenCode 的編碼整合。根據 DeepSeek 對 85 位開發者進行的調查,52% 的受訪者表示 V4-Pro 已可作為其預設的程式代理,另有 39% 傾向採用。舊版 deepseek-chat 與 deepseek-reasoner 端點將於 2026 年 7 月 24 日退役。

免責聲明:本頁面資訊可能來自第三方來源,僅供參考,不代表 Gate 的立場或觀點,亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險,請勿僅依賴本頁資訊作出決策。詳情請參閱 免責聲明
回覆
0/400
暫無回覆