Gate News 消息,4 月 24 日——DeepSeek 已在 MIT 许可下发布 V4 系列开源模型,权重现已在 Hugging Face 和 ModelScope 上提供。该系列包含两个专家混合 (MoE) 模型:V4-Pro 总参数 1.6 万亿,按每个 token 激活 49 亿;以及 V4-Flash 总参数 2840 亿,按每个 token 激活 130 亿。两者都支持 100 万 token 的上下文窗口。
该架构包含三项关键升级:一种混合注意力机制,结合压缩稀疏注意力 (CSA) 和高度压缩注意力 (HCA),从而显著降低长上下文开销——V4-Pro 在 1M 上下文下的推理 FLOPs 仅为 V3.2 的 27%,用于在推理过程中存储历史信息的 KV 缓存 (VRAM) 仅为 V3.2 的 10%;用流形约束超连接 (mHC) 替代传统残差连接,以增强跨层信号传播稳定性;以及 Muon 优化器以实现更快的训练收敛。预训练使用了超过 32 万亿 tokens 的数据。
后训练采用两阶段方法:首先通过监督微调 (SFT) 和 GRPO 强化学习训练领域特定专家,然后通过在线蒸馏将它们合并为单一模型。V4-Pro-Max (最高推理模式) 声称是最强的开源模型,拥有顶级代码基准,并在推理和智能体任务上显著缩小了与闭源前沿模型的差距。V4-Flash-Max 在算力充足的情况下实现了 Pro 级推理性能,但在纯知识和复杂智能体任务上受限于参数规模。权重以混合 FP4+FP8 精度存储。
إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى
إخلاء المسؤولية.
مقالات ذات صلة
OpenAI 工程师 Clive Chan 挑战 V4 硬件建议,称其相较 V3 存在错误与模糊之处
Gate News 消息,4 月 24 日——OpenAI 工程师 Clive Chan 就 V4 技术报告中的硬件建议章节提出了详细反对意见,称其相较备受赞誉的 V3 版本“出人意料地平庸且容易出错”。V3 的硬件指导包含 Q&A 会议
GateNewsمنذ 29 د
نَافيـر تطلق النسخة التجريبية لميزة AI Tab بعد دخول Google Gemini إلى سوق البحث في كوريا الجنوبية
رسالة أخبار جيت، 24 أبريل — أعلنت شركة نافيـر بدء النسخة التجريبية المغلقة لميزة AI Tab الجديدة، وهي ميزة بحث محادثي، وذلك بعد إطلاق جوجل لـ Gemini في كروم داخل كوريا الجنوبية.
ستظهر AI Tab إلى جانب تبويبات البحث الحالية لدى نافيـر، لتوفير مساحة مخصصة للمستخدمين لاستعلامات محادثية
GateNewsمنذ 41 د
توظيف هندسة الذكاء الاصطناعي في الهند يقفز بنسبة 59.5%، ويتوسع خارج مراكز التكنولوجيا
تقرير LinkedIn عن سوق العمل بالذكاء الاصطناعي لعام 2026، الذي صدر في 24 أبريل، وجد أن التوظيف في مجال هندسة الذكاء الاصطناعي في الهند ارتفع بنسبة 59.5% على أساس سنوي، ما يمثل أسرع وتيرة بين الأسواق التي درستها المنصة.
وكان هذا النمو مدفوعًا بتوسع الطلب خارج المراكز التقنية الراسخة. مدن تشمل
CryptoFrontierمنذ 1 س
بنك الكومنولث يخفض 120 وظيفة مع توسع الذكاء الاصطناعي
أعلنت مجموعة كومنويلث بنك أستراليا أنها ستُخفض ما يقارب 120 وظيفة، حيث يقوم أكبر بنك في البلاد بمراجعة أدواره وتوسيع استخدامه للذكاء الاصطناعي، وفقًا لوكالة بلومبرغ. تشمل عمليات التخفيض 43 دورًا في بنك ويست باينست في أستراليا الغربية، مع تأثر ست وظائف بالأتمتة. هذا أ
CryptoFrontierمنذ 1 س
كورسور يكشف سبب تدريب XAI: القدرة الحاسوبية كانت عالقة، وSpaceX تمتلك خيارات شراء بقيمة 60 مليار دولار أمريكي
أعلنت Anysphere أن Cursor سيتعاون مع xAI لتدريب نماذج جديدة باستخدام البنية التحتية Colossus من أجل تجاوز عنق الزجاجة في القدرة الحاسوبية؛ كما قدمت SpaceX خيار استحواذ بقيمة 60 مليار دولار (يمكن استحواذها بالكامل خلال عام 2026)، وإذا لم يحدث ذلك فستدفع حوالي 10 مليارات دولار كتعويض تعاوني. تتم المعاملتان في الوقت نفسه، مما يعيد تشكيل من يمكنه تدريب Cursor ومن يمكنه الاستحواذ عليه. ما يزال Cursor يسمح بخلفيات نماذج متعددة، لكن المسار على المدى الطويل يتوقف على ما إذا كانت SpaceX ستُمارس حق الاستحواذ.
ChainNewsAbmediaمنذ 1 س
تقييم السوق الثانوي للأنثروبيك يتخطى 1 تريليون دولار: Forge Global تتفوق على OpenAI بفارق 88.00 مليار
وفقًا لتقرير Decrypt، تبلغ التقييمات الثانوية لشركة Forge Global لدى Anthropic حوالي تريليون دولار، ولدى OpenAI حوالي 880 مليار دولار، وظهرت لأول مرة في السوق الثانوية إشارة لانعكاسٍ قيادي. ارتفع ARR لدى Anthropic من حوالي 9 مليارات في نهاية 2025 إلى حوالي 30 مليار في مارس 2026، أي نمو خلال ثلاثة أشهر بنسبة 233%، ما يدفع بتقييمات القطاع الخاص. تختلف التقييمات الثانوية عن التمويل في المرحلة الأولى، إذ تعكس ثقة الخروج؛ وما زال يُنظر إلى المستقبل على أنه سيستند إلى أربعة مسارات: التقنية والسياسات والأعمال والسرد.
ChainNewsAbmediaمنذ 1 س