DeepSeek V4 在 Putnam-2025 上取得满分成绩,与 Axiom 在形式化数学推理中并列第一

Gate News 消息,4月24日——DeepSeek V4 已发布来自形式化数学推理评测的结果,在 Putnam-2025 上获得满分 120/120,与 Axiom 并列第一。

在使用 LeanExplore 和受约束采样的实际模式下,V4-Flash-Max 在 Putnam-200 Pass@8 基准测试中得分 81.00,显著优于 Seed-2.0-Prover (35.50)、Gemini 3 Pro (26.50) 和 Seed-1.5-Prover (26.50)。前沿模式的结果显示,V4 在 Seed-1.5-Prover (110/120) 与 Aristotle (100/120) 之前。

V4 采用混合的形式化-非形式化推理方法:非形式化推理生成候选自然语言解答,自我验证用于筛选结果,而形式化智能体在 Lean 中完成严格证明。前沿结果采用了大规模计算扩展,而实际模式分数更能反映标准部署能力。

免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见声明

相关文章

NeoSoul 联合创始人 Kaelan:AI 行业应允许“玩具”存在,创新往往从实验性产品开始

Gate News 消息,4月24日——在最近于香港举办的智能加密金融论坛上,NeoSoul 联合创始人 Kaelan 分享了关于在早期阶段、快速演进的 AI 行业中评估 AI 项目的见解。除了评估当前产品之外,团队还必须展示出能够跟上底层模型能力的能力,他表示。

GateNews12 分钟前

Meta 与亚马逊达成多亿美元协议:为 AI 开发供应 Graviton 芯片

Gate News 消息,4月24日——根据《华尔街日报》报道,Meta Platforms 和亚马逊网络服务 (AWS) 已达成一项数十亿美元级别的协议,支持 Meta 未来数年的人工智能计划。在该协议下,Meta 将使用数千万颗 AWS Graviton 芯片核心来驱动其 AI 代理和其他 AI 项目。

GateNews23 分钟前

DeepSeek V4-Flash 登上 Ollama Cloud、美國主機:Claude Code、OpenClaw 一鍵串接

Ollama Cloud 已上架 DeepSeek V4-Flash,推理在美国主机,提供三组一键指令接入 Claude Code、OpenClaw、Hermes。V4-Flash/V4-Pro 采用 MoE 架构、原生支持 1M 上下文,并以 Token-wise 压缩+DSA 稀疏注意力降低成本,1M 情境下单 token FLOPs 降低 27%、KV 缓存降低 10%。API 相容 OpenAI ChatCompletions 与 Anthropic,便于多工作流切换,降低成本与数据主权风险。

鏈新聞abmedia1小时前

Web3 AI 基础设施 AIW3 完成 $2M 种子轮融资,Buffalo Capital 牵头

Gate News 消息,4月24日——Web3 AI 基础设施平台 AIW3 宣布完成一轮 $2 百万美元种子轮融资。本轮融资由 Buffalo Capital 牵头,GalaXin Capital 和 Three-stones Ventures 参与作为共同投资方。 AIW3 正在向 Agent-as-a-Service

GateNews2小时前

Cohere 收购德国 AI 公司 Aleph Alpha,斩获 $600M 投资用于欧洲扩张

Gate 新闻消息,4月24日——加拿大 AI 公司 Cohere 宣布计划收购德国 AI 公司 Aleph Alpha,以加强其在欧洲的布局。Aleph Alpha 的支持方 Schwarz Group 计划在 Cohere 的 E 轮融资中投资 $600 百万。 预计该融资轮将于 202

GateNews2小时前

小鹏、Redmi 牵头:北京车展上的车载 AI 推进

快讯,4月24日——随着中国加速推进 AI Plus 战略,并寻求在国外半导体方面获得更大独立性,中国车企在4月24日的北京车展上展示了先进的车载 AI 系统。 小鹏展示了语音控制泊车功能,允许驾驶员“通过

GateNews3小时前
评论
0/400
暂无评论