DeepSeek V4终于发布了!


对比了一下
目前是当前开源最强大模型了
在代码、数学、长文本、Agent四大领域达到全球第一梯队,部分指标超越GPT-4o、Claude Opus 4.6。

一、版本与定位

- V4-Pro:旗舰,对标GPT-4o/Opus 4.6,开源最强。
- V4-Flash:轻量高速,性价比高。
- 架构:1.6T参数MoE,每次激活约370B;100万Token上下文。
- 算力:全栈华为昇腾950PR,去英伟达化。

二、核心性能对比(权威评测)

1️⃣ 编程(最强项)

- HumanEval:90%(>Opus 4.5 88%、>GPT-4 82%)。
- SWE-Bench:>80%,真实软件工程能力领先。
- 结论:全球最强AI程序员。

2️⃣ 数学/推理

- MATH/STEM:超越所有开源模型,比肩GPT-4o/Opus 4.6。
- Agent能力:Agentic Coding达开源最佳,优于Claude Sonnet 4.5,接近Opus 4.6(非思考模式)。

3️⃣ 长文本

- 上下文:1M Token(≈70万汉字),全球前三(仅次于Gemini 3.1)。
- 实测:百万字小说/整库分析不崩,长文本最强国产模型。

4️⃣ 世界知识

- 领先所有开源模型,略低于Gemini 3.1 Pro。

三、综合排行(2026.4.24)

- 闭源第一梯队:
1. Gemini 3.1 Pro(推理/长文本最强)
2. Claude Opus 4.6(全能均衡)
3. GPT-4o(生态最强)
4. DeepSeek V4-Pro(代码/长文本顶尖,国产第一)
- 开源第一梯队:
- DeepSeek V4-Pro(绝对第一,全面领先Llama 3/Qwen 3)

四、关键优势

- ✅ 代码最强:超越GPT-4o/Claude,工程级任务能力。
- ✅ 1M上下文:长文本处理全球顶级。
- ✅ 国产算力:昇腾全栈,成本仅GPT-4的1/70。
- ✅ 开源可商用:V4-Pro/Flash开源,MIT协议。

五、短板

- 综合能力略逊于Gemini 3.1/Opus 4.6(尤其深度推理)。
- 多模态(图文)能力弱于GPT-4o/Gemini。
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 回覆
  • 轉發
  • 分享
回覆
請輸入回覆內容
請輸入回覆內容
暫無回覆