ゲートニュース(4月25日)— DeepSeekは4月24日にV4-ProおよびV4-Flashのプレビュー版をリリースした。どちらも100万トークンのコンテキストウィンドウを持つオープンウェイトモデルである。V4-Proは総パラメータ1.6兆を備えるが、Mixture-of-Expertsアーキテクチャを用いて推論1回あたり49億のみを有効化する。V4-Flashは総パラメータ2840億で、アクティブは130億。
価格は競合に比べて大幅に低い:V4-Proは入力が100万トークンあたり$1.74、出力が100万トークンあたり$3.48で、OpenAIのGPT-5.5 Proに比べて約98%安い—($30 input、$180 output)およびClaude Opus 4.7の約5分の1のコストである。V4-Flashは100万トークンあたり入力$0.14、出力$0.28。両モデルはMITライセンスの下でオープンソースで、ローカルで無料実行できる。
DeepSeekは2つの新しい注意メカニズムによって効率向上を実現した:Compressed Sparse AttentionとHeavily Compressed Attentionで、V4-Proの前身 (V3.2)の計算コストを27%に、V4-Flashでは10%にまで削減する。DeepSeekはV4を部分的にHuawei Ascendチップで学習し、高度なNvidiaプロセッサに対する米国の輸出規制を回避した。同社は、2026年後半に新たな950のスーパーノードがオンラインになると、価格がさらに下がると述べた。
性能ベンチマークでは、V4-Pro-MaxはCodeforcesの競技プログラミング (3,206スコアで1位となり、人間の参加者の中で約23位に相当)し、Apex Shortlistの数学問題では90.2%を獲得した(Claude Opus 4.6は85.9%)。しかしマルチタスクのベンチマークでは後れを取る:MMLU-Pro (87.5%対Gemini-3.1-Proの91.0%)、Humanity's Last Exam (37.7%対44.4%)。長いコンテキストのタスクでは、V4-Proはオープンソースモデルに勝つが、MRCRのリトリーバルテストではClaude Opus 4.6に敗れる。
V4-Proは「interleaved thinking」を導入し、エージェントのワークフローが、複数のツール呼び出しにわたって推論コンテキストを保持し、ステップ間でフラッシュしないようにする。両モデルはClaude CodeおよびOpenCodeとのコーディング統合をサポートする。DeepSeekの開発者サーベイ(85ユーザー)によると、52%がV4-Proはデフォルトのコーディングエージェントとして準備できていると回答し、39%が導入に前向きだった。旧deepseek-chatおよびdeepseek-reasonerのエンドポイントは、2026年7月24日に廃止される。