DeepSeekがV4-ProとV4-Flashモデルを、OpenAIのGPT-5.5 Proより98%低コストでリリース

ゲートニュース(4月25日)— DeepSeekは4月24日にV4-ProおよびV4-Flashのプレビュー版をリリースした。どちらも100万トークンのコンテキストウィンドウを持つオープンウェイトモデルである。V4-Proは総パラメータ1.6兆を備えるが、Mixture-of-Expertsアーキテクチャを用いて推論1回あたり49億のみを有効化する。V4-Flashは総パラメータ2840億で、アクティブは130億。

価格は競合に比べて大幅に低い:V4-Proは入力が100万トークンあたり$1.74、出力が100万トークンあたり$3.48で、OpenAIのGPT-5.5 Proに比べて約98%安い—($30 input、$180 output)およびClaude Opus 4.7の約5分の1のコストである。V4-Flashは100万トークンあたり入力$0.14、出力$0.28。両モデルはMITライセンスの下でオープンソースで、ローカルで無料実行できる。

DeepSeekは2つの新しい注意メカニズムによって効率向上を実現した:Compressed Sparse AttentionとHeavily Compressed Attentionで、V4-Proの前身 (V3.2)の計算コストを27%に、V4-Flashでは10%にまで削減する。DeepSeekはV4を部分的にHuawei Ascendチップで学習し、高度なNvidiaプロセッサに対する米国の輸出規制を回避した。同社は、2026年後半に新たな950のスーパーノードがオンラインになると、価格がさらに下がると述べた。

性能ベンチマークでは、V4-Pro-MaxはCodeforcesの競技プログラミング (3,206スコアで1位となり、人間の参加者の中で約23位に相当)し、Apex Shortlistの数学問題では90.2%を獲得した(Claude Opus 4.6は85.9%)。しかしマルチタスクのベンチマークでは後れを取る:MMLU-Pro (87.5%対Gemini-3.1-Proの91.0%)、Humanity's Last Exam (37.7%対44.4%)。長いコンテキストのタスクでは、V4-Proはオープンソースモデルに勝つが、MRCRのリトリーバルテストではClaude Opus 4.6に敗れる。

V4-Proは「interleaved thinking」を導入し、エージェントのワークフローが、複数のツール呼び出しにわたって推論コンテキストを保持し、ステップ間でフラッシュしないようにする。両モデルはClaude CodeおよびOpenCodeとのコーディング統合をサポートする。DeepSeekの開発者サーベイ(85ユーザー)によると、52%がV4-Proはデフォルトのコーディングエージェントとして準備できていると回答し、39%が導入に前向きだった。旧deepseek-chatおよびdeepseek-reasonerのエンドポイントは、2026年7月24日に廃止される。

免責事項:本ページの情報には第三者提供の内容が含まれる場合があり、参考目的のみで提供されています。これらはGateの見解や意見を示すものではなく、金融、投資、または法律上の助言を構成するものでもありません。暗号資産取引には高いリスクが伴います。意思決定を行う際には、本ページの情報のみに依存しないでください。詳細については、免責事項をご確認ください。
コメント
0/400
コメントなし