DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4 月 24 日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上取得满分 120/120,与 Axiom 并列第一。

在使用 LeanExplore 与受约束采样的实践模式中,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著超过 Seed-2.0-Prover (35.50)、Gemini 3 Pro (26.50) 和 Seed-1.5-Prover (26.50)。前沿模式结果显示,V4 领先于 Seed-1.5-Prover (110/120) 和 Aristotle (100/120)。

V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选的自然语言解答,自我验证对结果进行筛选,而形式化智能体在 Lean 中完成严格证明。前沿模式结果使用了大规模计算扩展,而实践模式得分更能反映标准部署能力。

إخلاء المسؤولية: قد تكون المعلومات الواردة في هذه الصفحة من مصادر خارجية ولا تمثل آراء أو مواقف Gate. المحتوى المعروض في هذه الصفحة هو لأغراض مرجعية فقط ولا يشكّل أي نصيحة مالية أو استثمارية أو قانونية. لا تضمن Gate دقة أو اكتمال المعلومات، ولا تتحمّل أي مسؤولية عن أي خسائر ناتجة عن استخدام هذه المعلومات. تنطوي الاستثمارات في الأصول الافتراضية على مخاطر عالية وتخضع لتقلبات سعرية كبيرة. قد تخسر كامل رأس المال المستثمر. يرجى فهم المخاطر ذات الصلة فهمًا كاملًا واتخاذ قرارات مدروسة بناءً على وضعك المالي وقدرتك على تحمّل المخاطر. للتفاصيل، يرجى الرجوع إلى إخلاء المسؤولية.

مقالات ذات صلة

المؤسس المشارك لـ NeoSoul، كايلان: ينبغي أن تسمح صناعة الذكاء الاصطناعي بوجود الألعاب، وغالبًا ما تبدأ الابتكارات كمنتجات تجريبية

بوابة الأخبار رسالة، 24 أبريل — في منتدى حديث في هونغ كونغ حول التمويل الذكي المشفر، شارك المؤسس المشارك لـ NeoSoul، كايلان، رؤى حول كيفية تقييم مشاريع الذكاء الاصطناعي في المرحلة المبكرة، داخل صناعة ذكاء اصطناعي تتطور بسرعة. وبالإضافة إلى تقييم المنتجات الحالية، يجب على الفرق إظهار القدرة على مواكبة قدرات النموذج الأساسية، كما قال. Beyond assessing current products, teams must demonstrate the ability to keep pace with underlying model capabilities, he stated. كايلان أكد أن ريادة أعمال الذكاء الاصطناعي تتطلب كلاً من الإتزان والرؤية: الإتزان يعني امتلاك قدرات التنفيذ الهندسي وتصميم المنتج وفهم السوق لتقديم منتجات ملموسة؛ أما الرؤية فتعني البناء بما يتماشى مع اتجاهات تطور النماذج اللغوية الكبيرة. جادل كايلان بأنه في حين قد تبدو بعض منتجات الذكاء الاصطناعي في المرحلة المبكرة أقرب إلى الألعاب، ينبغي السماح بمثل هذه الأشكال في الصناعات الناشئة. فالكثير من paradigms الجديدة حقًا لا تظهر أولاً إلا على هيئة منتجات تجريبية قبل أن تصل إلى النضج.

GateNewsمنذ 12 د

Meta وAmazon تتفقان على صفقة متعددة المليارات لتوريد شرائح Graviton لتطوير الذكاء الاصطناعي

رسالة أخبار بوابة، 24 أبريل — أفادت صحيفة وول ستريت جورنال بأن شركة Meta Platforms وشركة Amazon Web Services (AWS) قد توصلتا إلى اتفاق متعدد المليارات لدعم مبادرات Meta في مجال الذكاء الاصطناعي خلال السنوات المقبلة. ووفقًا للاتفاق، ستستخدم Meta عشرات الملايين من أنوية شرائح AWS Graviton لتشغيل وكلاء الذكاء الاصطناعي لديها ومشاريع ذكاء اصطناعي أخرى.

GateNewsمنذ 23 د

DeepSeek V4-Flash يصل إلى Ollama Cloud، استضافة أمريكية: Claude Code، OpenClaw توصيل بنقرة واحدة

تم إدراج Ollama Cloud DeepSeek V4-Flash، والاستدلال على خوادم في الولايات المتحدة، مع توفير ثلاث مجموعات من أوامر بنقرة واحدة للاتصال بـ Claude Code وOpenClaw وHermes. تعتمد V4-Flash/V4-Pro بنية MoE، وتدعم أصلاً سياقًا سَعته 1M، كما تُخفض التكاليف عبر ضغط Token-wise + انتباه متفرّق DSA؛ في سيناريو 1M ينخفض استهلاك FLOPs لكل توكن بنسبة 27%، وتنخفض ذاكرة التخزين المؤقت لـ KV بنسبة 10%. واجهات برمجية متوافقة مع OpenAI ChatCompletions وAnthropic، ما يسهّل تبديل مهام العمل بين سير عمل متعددة، ويقلل التكاليف ومخاطر السيادة على البيانات.

ChainNewsAbmediaمنذ 1 س

بنية Web3 للذكاء الاصطناعي AIW3 ترفع $2M في تمويل بذري بقيادة Buffalo Capital

خبر بوابة، 24 أبريل — أعلنت منصة بنية Web3 للذكاء الاصطناعي AIW3 عن إتمام جولة تمويل بذري بقيمة $2 مليون. قاد الجولة Buffalo Capital، مع مشاركة GalaXin Capital وThree-stones Ventures كمستثمرين مشاركين. تنتقل AIW3 نحو نموذج تنفيذ على السلسلة Agent-as-a-Service AaaS، مع توفير خدمات استراتيجيات قابلة للاستدعاء، وتنسيق وكلاء مستقلين، وتدفقات رأسمالية أصلية منسقة عبر المحافظ. يهدف المشروع إلى بناء طبقة تنفيذ على السلسلة على مستوى النظام من الجيل التالي. ذكرَت الشركة أن البنية الأساسية لبروتوكولها قد دخلت رسميًا مرحلة تشغيلية آنية قابلة للتحقق بالكامل، لتضع الأساس لتطوير طويل الأجل لشبكة وكلاء لامركزية قابلة للتوسع وبيئتها.

GateNewsمنذ 2 س

Cohere تستحوذ على شركة الذكاء الاصطناعي الألمانية Aleph Alpha، وتؤمن استثمار $600M للتوسع في أوروبا

بوابة الأخبار، 24 أبريل — أعلنت شركة الذكاء الاصطناعي الكندية Cohere عن خطط للاستحواذ على شركة الذكاء الاصطناعي الألمانية Aleph Alpha لتعزيز وجودها في أوروبا. يخطط Schwarz Group، وهو داعم لـ Aleph Alpha، للاستثمار $600 مليونًا في جولة التمويل من السلسلة E لدى Cohere. من المتوقع أن تُختتم جولة التمويل في 202

GateNewsمنذ 2 س

Xpeng、小米在北京车展引领车载AI浪潮

快讯消息,4月24日——中国汽车制造商在4月24日举行的北京车展上展示了先进的车载AI系统,随着该国加速推进AI Plus战略,并寻求在对外部半导体的依赖方面获得更大独立性。 Xpeng展示了语音控制泊车功能,允许驾驶员通过“

GateNewsمنذ 3 س
تعليق
0/400
لا توجد تعليقات