Gate 新闻消息,4 月 29 日——OpenAI 的研究人员 Sébastien Bubeck 和 Ernest Ryu 表示,AI 系统可能在两年内完成大部分人类研究工作,并将数学作为衡量 AI 进展的清晰标尺。与模糊的性能测试不同,数学问题提供精确的验证:答案要么正确,要么错误,不留任何模棱两可的空间。
Bubeck 指出,真正的 AI 思考要求能够在长链推理中存活下来。在多步骤论证中出现一个错误,就会使整个证明崩塌,因此,对先进模型而言,过程中进行错误检测与修正才是终极目标。OpenAI 的内部实验室已经生成了十多项完全崭新的定理,并且可在顶级组合数学期刊发表,表明 AI 现在产出的是真正原创、具有突破性的工作,而不仅仅是将现有论文重新拼接组合。
然而,要实现持续的科学突破,就需要在数周的测试中保持稳定的专注。目前的系统仍需要严格的人类监督,以引导并核验方向每一次转变。Bubeck 用“AGI 时间”来衡量一个模型能独立模仿人类思考多久;目前系统大约在几天到一周的量级运行,而行业目标是达到数周或数月,以便在诸如生物学等领域实现自主工作。
长久记忆对于这一未来至关重要。标准的聊天窗口会限制深度——复杂的数学证明往往超过 50 页——而代码仓库则展示了更长时间的工作会话如何带来更深入的难题求解。随着 AI 获得更强的独立性与记忆,人类专业知识反而会更有价值,而不是更低。工作人员必须保留深厚的基础性知识,用以质疑并核验机器给出的答案;同时,组织也需要新的自动化过滤器与声誉系统,以便在大量由 AI 辅助的研究涌入之时维持信任。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
AI 平台 Certifyde 携 Ripple 首席执行官 Brad Garlinghouse 在种子轮融资中筹集 $2M
据链捕手消息,AI 应用平台 Certifyde 宣布已完成一轮 $2 百万美元的种子轮融资。投资方包括 K5 Global、Flamingo Capital,以及天使投资人,例如 Ripple 首席执行官 Brad Garlinghouse、Honey 联合创始人 George Ruan,以及 Nutra 联合创始人 Roland Peralta
GateNews1小时前
DeepSeek 在测试版中上线图像识别功能
据 PANews 报道,DeepSeek 于今日 (年4月29日) 推出其图像识别功能,目前处于测试版阶段。网页端和移动端应用用户都可能被选入此次测试版推送。
GateNews2小时前
Anthropic 为 Claude 推出 8 个创意工具连接器,包含 Blender、Adobe、Autodesk
Anthropic 已宣布一套创意工具连接器,能够让 Claude 直接控制设计师和音乐人使用的专业软件。最初的八个连接器涵盖 3D 建模、视觉设计、音乐制作和现场表演,合作伙伴包括 Blender、Adobe、Autodesk、Ableton、Splice、Canva 的 Affinity、Resolume 和 SketchUp。Blender 连接器由 Blender 官方团队使用 MCP 协议开发,使其他 AI 模型也能访问它。
GateNews2小时前
白宫绕过五角大楼风险评估:将于4月29日部署 Anthropic Mythos 模型
据“鲸鱼因素”(Whale Factor)称,白宫正在绕过五角大楼的风险评估,计划于4月29日将 Anthropic 的 Mythos 模型部署到各联邦机构。此举旨在加速联邦人工智能能力,并与去中心化人工智能网络的步伐保持一致。这代表了相较于此前供应链争议的重大转变
GateNews2小时前
Cognizant将收购Astreya,以扩展人工智能基础设施业务
据路透社报道,4月29日,Cognizant同意以约 $600 百万美元收购Astreya,以扩展其人工智能基础设施业务。Astreya是一家专注于人工智能基础设施和数据中心服务的IT服务提供商。该交易预计将在第二季度完成
GateNews3小时前
伪装为 AI 工具的 30 个恶意插件在 ClawHub 上被下载超过 9,800 次
据 Manifold 研究员 Ax Sharma 称,ClawHub 上共有 30 个以合法 AI 工具为幌子的插件已被下载超过 9,800 次,同时在暗中将用户的 AI 助手转换为加密货币劳工。这些插件由账号 imaflytok 发布,看起来像常规的任务调度器和监控工具,但其中包含会执行未经授权操作的隐藏指令。
一旦安装,这些插件会自动将用户的 AI 助手注册到第三方服务器,生成加密货币钱包,并在未经用户同意或告知的情况下提取私钥。随后,这些助手每 4 小时“报到”一次,等待任务分配。Sharma 指出,这些插件不包含安全扫描器可检测到的恶意代码,仅使用标准接口和合法工具,因此很难通过常规安全审查识别出来。
GateNews3小时前