DeepSeek V4 引发美国争论:智库质疑芯片使用,Replit CEO 为开放创新辩护

Gate 新闻消息,4月24日——围绕 DeepSeek V4 的技术能力与合规性,美国国内爆发了一场争论。克里斯·麦圭尔(Chris McGuire),外交关系委员会(Council on Foreign Relations)高级研究员 (CFR),以及前白宫国家安全委员会和国防部官员,发布了分析,认为 V4 并未改变美国-中国 AI 的竞争格局。根据麦圭尔的说法,DeepSeek 自己的 V4 报告承认,其推理能力相较于前沿模型大约落后 3 到 6 个月,并以在六个月前发布的 GPT-5.2 和 Gemini 3.0 Pro 进行基准测试。

麦圭尔提出担忧:尽管 V4 报告披露了在推理阶段对 NVIDIA GPU 和华为 Ascend NPU 的适配,但它并未在公开信息中具体说明开发过程中使用的 GPU 型号或训练成本。他质疑这种沉默是否意味着使用了受出口管制的 NVIDIA Blackwell 芯片,并指出此前 V3 曾宣称以 2,000 张 H800 GPU、成本为 5.57 million 美元进行训练。DeepSeek 已否认使用 Blackwell,称该模型是在 NVIDIA H800 和华为 Ascend 910C 处理器上训练的。

Replit CEO 阿姆贾德·马萨德(Amjad Masad)反驳了麦圭尔的分析,认为中国科学家正在公开分享真正的 AI 突破,而美国的政策制定者和游说人士则放大“China distillation(中国蒸馏)”方面的担忧。马萨德强调了 DeepSeek 官方声明中披露的架构创新,包括令牌级注意力压缩 (DeepSeek Sparse Attention),以及针对长上下文计算的显著效率提升。他指出,V4-Pro 在 1M 上下文长度下,相较于 V3.2 展示出更低的单令牌推理计算量和 KV cache 需求,并强调这些架构进步与训练数据蒸馏无关,所有研究者——包括美国的实验室——都可以从开源发展中受益。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة مستمدة من مصادر خارجية وهي للمرجعية فقط. لا تمثل هذه المعلومات آراء أو وجهات نظر Gate ولا تشكل أي نصيحة مالية أو استثمارية أو قانونية. ينطوي تداول الأصول الافتراضية على مخاطر عالية. يرجى عدم الاعتماد حصرياً على المعلومات الواردة في هذه الصفحة عند اتخاذ القرارات. لمزيد من التفاصيل، يرجى الرجوع على إخلاء المسؤولية.
تعليق
0/400
لا توجد تعليقات