Gate News 消息,4 月 24 日——OpenAI 工程师 Clive Chan 就 V4 技术报告中的硬件建议章节提出了详细异议,称其“出人意料地平庸且容易出错”,与备受赞誉的 V3 版本相比尤为如此。V3 的硬件指导,其中包括问答(Q&A)环节,这些环节成为 ISCA 学术会议上最受欢迎的讨论话题,并提供了与业界互连标准相匹配的具体建议。相比之下,V4 则要模糊得多。
Chan 系统性地质疑了三项关键建议。关于功耗,报告指出,软件优化允许芯片在同一时间以满负荷运行计算、存储与通信,并建议芯片制造商预留更多的功率余量。Chan 认为这适得其反:芯片的总功耗受物理工艺限制所约束,因此预留更大的功耗裕量只会降低工作频率,最终减少计算性能。关于 GPU 到 GPU 的数据传输,报告主张采用拉取(pull)模型——由 GPU 主动获取数据——而非推送(push)模型,并称在推送操作中存在较高的通知开销。Chan 则对此提出异议,认为拉取实际上更慢,并且更优的是提升网络适配器能力。然而,这两者可能在讨论问题的不同层面:报告谈的是通知机制的开销,而 Chan 指的是传输延迟本身。
关于激活函数,报告建议用更简单的函数来替换 SwiGLU,以降低计算负担。Chan 认为这没有任何价值,并指出 Sonic MoE 已经通过使用 SwiGLU 展示了最佳性能。Chan 怀疑 DeepSeek 可能“故意削弱了这一部分。”
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
AI 平台 Certifyde 携 Ripple 首席执行官 Brad Garlinghouse 在种子轮融资中筹集 $2M
据链捕手消息,AI 应用平台 Certifyde 宣布已完成一轮 $2 百万美元的种子轮融资。投资方包括 K5 Global、Flamingo Capital,以及天使投资人,例如 Ripple 首席执行官 Brad Garlinghouse、Honey 联合创始人 George Ruan,以及 Nutra 联合创始人 Roland Peralta
GateNews5 分钟前
DeepSeek 在测试版中上线图像识别功能
据 PANews 报道,DeepSeek 于今日 (年4月29日) 推出其图像识别功能,目前处于测试版阶段。网页端和移动端应用用户都可能被选入此次测试版推送。
GateNews1小时前
Anthropic 为 Claude 推出 8 个创意工具连接器,包含 Blender、Adobe、Autodesk
Anthropic 已宣布一套创意工具连接器,能够让 Claude 直接控制设计师和音乐人使用的专业软件。最初的八个连接器涵盖 3D 建模、视觉设计、音乐制作和现场表演,合作伙伴包括 Blender、Adobe、Autodesk、Ableton、Splice、Canva 的 Affinity、Resolume 和 SketchUp。Blender 连接器由 Blender 官方团队使用 MCP 协议开发,使其他 AI 模型也能访问它。
GateNews1小时前
白宫绕过五角大楼风险评估:将于4月29日部署 Anthropic Mythos 模型
据“鲸鱼因素”(Whale Factor)称,白宫正在绕过五角大楼的风险评估,计划于4月29日将 Anthropic 的 Mythos 模型部署到各联邦机构。此举旨在加速联邦人工智能能力,并与去中心化人工智能网络的步伐保持一致。这代表了相较于此前供应链争议的重大转变
GateNews1小时前
Cognizant将收购Astreya,以扩展人工智能基础设施业务
据路透社报道,4月29日,Cognizant同意以约 $600 百万美元收购Astreya,以扩展其人工智能基础设施业务。Astreya是一家专注于人工智能基础设施和数据中心服务的IT服务提供商。该交易预计将在第二季度完成
GateNews1小时前
伪装为 AI 工具的 30 个恶意插件在 ClawHub 上被下载超过 9,800 次
据 Manifold 研究员 Ax Sharma 称,ClawHub 上共有 30 个以合法 AI 工具为幌子的插件已被下载超过 9,800 次,同时在暗中将用户的 AI 助手转换为加密货币劳工。这些插件由账号 imaflytok 发布,看起来像常规的任务调度器和监控工具,但其中包含会执行未经授权操作的隐藏指令。
一旦安装,这些插件会自动将用户的 AI 助手注册到第三方服务器,生成加密货币钱包,并在未经用户同意或告知的情况下提取私钥。随后,这些助手每 4 小时“报到”一次,等待任务分配。Sharma 指出,这些插件不包含安全扫描器可检测到的恶意代码,仅使用标准接口和合法工具,因此很难通过常规安全审查识别出来。
GateNews1小时前