DeepSeek 以 98% 低於 OpenAI 的 GPT-5.5 Pro 成本發布 V4-Pro 與 V4-Flash 模型

2026-04-25 12:31:48

Gate News 消息，4 月 25 日——DeepSeek 於 4 月 24 日發布 V4-Pro 與 V4-Flash 的預覽版本；兩者皆為開放權重模型，擁有一百萬 token 的上下文視窗。V4-Pro 具備 1.6 兆的總參數，但在每次推論時僅啟用 490 億參數，並採用 Mixture-of-Experts 架構。V4-Flash 具備 2,840 億的總參數，其中啟用 130 億。

定價顯著低於競品：V4-Pro 的每百萬輸入 token 成本為 $1.74，每百萬輸出 token 成本為 $3.48——約比 OpenAI 的 GPT-5.5 Pro 低 98% ($30 input，$180 output)；且其成本約為 Claude Opus 4.7 的五十分之一。V4-Flash 的價格為每百萬 token 輸入 $0.14、輸出 $0.28。兩款模型均以 MIT 授權開源，且可在本地免費運行。

DeepSeek 透過兩種新的注意力機制實現效率提升：Compressed Sparse Attention 與 Heavily Compressed Attention，將計算成本降低至 V4-Pro 前代機型的 27% (V3.2)，以及將 V4-Flash 降至 10%。該公司在部分 V4 訓練中使用了華為 Ascend 晶片，繞過了美國對先進 Nvidia 處理器的出口限制。DeepSeek 表示，待 2026 年下半年新增 950 個新超節點啟動後，定價還將進一步下調。

在效能基準測試中，V4-Pro-Max 在 Codeforces 競賽程式設計 (3,206 分排名第一，位於人類參賽者中的約第 23 名)，並在 Apex Shortlist 數學題上取得 90.2% 的分數，而 Claude Opus 4.6 為 85.9%。然而，它在多任務基準上表現落後：MMLU-Pro (87.5% 對比 Gemini-3.1-Pro 的 91.0%)，以及 Humanity's Last Exam (37.7% 對比 44.4%)。在長上下文任務上，V4-Pro 領先開源模型，但在 MRCR 檢索測試中落後於 Claude Opus 4.6。

V4-Pro 引入“interleaved thinking（交錯式思考）”，使代理工作流程能在多次工具呼叫之間保留推理上下文，而無需在步驟之間刷新。兩款模型均支援與 Claude Code 與 OpenCode 的編碼整合。根據 DeepSeek 對 85 位開發者進行的調查，52% 的受訪者表示 V4-Pro 已可作為其預設的程式代理，另有 39% 傾向採用。舊版 deepseek-chat 與 deepseek-reasoner 端點將於 2026 年 7 月 24 日退役。

View Source

免責聲明：本頁面資訊可能來自第三方來源，僅供參考，不代表 Gate 的立場或觀點，亦不構成任何財務、投資或法律建議。虛擬資產交易具有高風險，請勿僅依賴本頁資訊作出決策。詳情請參閱免責聲明。