对比了一下
目前是当前开源最强大模型了
在代码、数学、长文本、Agent四大领域达到全球第一梯队，部分指标超越GPT-4o、Claude Opus 4.6。

一、版本与定位

- V4-Pro：旗舰，对标GPT-4o/Opus 4.6，开源最强。
- V4-Flash：轻量高速，性价比高。
- 架构：1.6T参数MoE，每次激活约370B；100万Token上下文。
- 算力：全栈华为昇腾950PR，去英伟达化。

二、核心性能对比（权威评测）

1️⃣ 编程（最强项）

- HumanEval：90%（>Opus 4.5 88%、>GPT-4 82%）。
- SWE-Bench：>80%，真实软件工程能力领先。
- 结论：全球最强AI程序员。

2️⃣ 数学/推理

- MATH/STEM：超越所有开源模型，比肩GPT-4o/Opus 4.6。
- Agent能力：Agentic Coding达开源最佳，优于Claude Sonnet 4.5，接近Opus 4.6（非思考模式）。

3️⃣ 长文本

- 上下文：1M Token（≈70万汉字），全球前三（仅次于Gemini 3.1）。
- 实测：百万字小说/整库分析不崩，长文本最强国产模型。

4️⃣ 世界知识

- 领先所有开源模型，略低于Gemini 3.1 Pro。

三、综合排行（2026.4.24）

- 闭源第一梯队：
1. Gemini 3.1 Pro（推理/长文本最强）
2. Claude Opus 4.6（全能均衡）
3. GPT-4o（生态最强）
4. DeepSeek V4-Pro（代码/长文本顶尖，国产第一）
- 开源第一梯队：
- DeepSeek V4-Pro（绝对第一，全面领先Llama 3/Qwen 3）

四、关键优势

- ✅ 代码最强：超越GPT-4o/Claude，工程级任务能力。
- ✅ 1M上下文：长文本处理全球顶级。
- ✅ 国产算力：昇腾全栈，成本仅GPT-4的1/70。
- ✅ 开源可商用：V4-Pro/Flash开源，MIT协议。

五、短板

- 综合能力略逊于Gemini 3.1/Opus 4.6（尤其深度推理）。
- 多模态（图文）能力弱于GPT-4o/Gemini。

此頁面可能包含第三方內容，僅供參考（非陳述或保證），不應被視為 Gate 認可其觀點表述，也不得被視為財務或專業建議。詳見聲明。

打賞
按讚
回覆
轉發
分享

回覆

請輸入回覆內容

暫無回覆

熱門話題
查看更多
#
TradFi交易分享挑戰
22.65萬熱度
#
灰度購入超51萬HYPE並質押
891.39萬熱度
#
Polymarket每日熱點
101.86萬熱度
#
SpaceX正式提交IPO申請
74.82萬熱度
#
Gate廣場披薩節
171.09萬熱度

DeepSeek V4终于发布了！

熱門話題

TradFi交易分享挑戰

灰度購入超51萬HYPE並質押

Polymarket每日熱點

SpaceX正式提交IPO申請

Gate廣場披薩節

已置頂