Gate News 消息,4 月 10 日,今日全球权威 AI 评测平台 LMArena(百万用户参与盲测的 AI 模型评测平台)更新 Code Arena 专项榜单,GLM-5.1 登顶全球开源模型第一,位列全球模型第三。
GLM-5.1 不仅继承了上一代模型的开源 SOTA 编码能力,还在长程任务(Long-Horizon Task)上取得突破,实现了:8 小时从零构建 Linux 桌面;655 次迭代打破向量数据库优化瓶颈;1000 轮工具调用优化真实机器学习模型负载。
值得一提的是,在 METR 榜单的同等评估标准下,GLM-5.1 是唯一达到 8 小时级持续工作的开源模型,也是全球范围内除 Claude Opus 4.6 外少数具备这一能力的模型。
免责声明:本页面信息可能来自第三方,不代表 Gate 的观点或意见。页面显示的内容仅供参考,不构成任何财务、投资或法律建议。Gate 对信息的准确性、完整性不作保证,对因使用本信息而产生的任何损失不承担责任。虚拟资产投资属高风险行为,价格波动剧烈,您可能损失全部投资本金。请充分了解相关风险,并根据自身财务状况和风险承受能力谨慎决策。具体内容详见
声明。
相关文章
新世界集团放弃与 OpenAI 的合作,转向与 Reflection AI 的伙伴关系,调整零售战略
新世界集团已暂停与 OpenAI 的合作,选择与 Reflection AI 进行更深度的协作,以提升零售运营中的人工智能能力。该决定旨在简化相关工作,并解决关于 AI 商务(AI commerce)有效性的担忧。
GateNews17 分钟前
OpenAI 和 Google 增加对 HWP 格式的支持,韩讯寻求估值回升
OpenAI 的 ChatGPT 现在支持 HWP 和 HWPX 文件格式,使韩国用户能够直接上传文档进行分析,而无需进行转换。这提升了本地企业的易用性,并可能在近期下跌之际推动韩讯(Hancom)股价的反弹。
GateNews18 分钟前
谷歌使用 AI 在韩国移除 1.755 亿条广告,暂停 32.6 万名广告主账户
2025 年,谷歌使用 AI 在韩国移除 1.755 亿条违规广告,暂停了 326,000 个账户,并因隐私违规面临 $50 百万的罚款,这凸显了执法力度不断增强以及 AI 在打击广告欺诈方面的作用。
GateNews18 分钟前
随着 AI 投资持续,Naver 和 Kakao 有望发布强劲的 2026 年第一季度业绩
Naver 和 Kakao 预计将因电商与广告带动而实现强劲的 2026 年第一季度业绩,尽管早期阶段的 AI 产品影响有限。两家公司都在显著加大 AI 基础设施投入,并调整策略以将 AI 融入现有服务。
GateNews1小时前
Anthropic 发布 Claude Opus 4.7,但削弱了网络能力
Anthropic 于 4 月 16 日 (当地时间) 发布了其旗舰模型的升级版本 Claude Opus 4.7。与之前的 Opus 4.6 模型相比,Opus 4.7 在先进软件工程能力方面展现出“显著提升”,尤其是在困难任务上,并通过更强的严谨性与在复杂、长时间运行操作中的一致性,以及改进的视觉能力来实现。然而,Anthropic 在训练期间刻意削弱了该模型的网络安全攻击-防御能力,并引入安全机制以自动检测并拦截被禁止或高风险的请求。
Crypto Frontier1小时前
xAI 将为 Cursor 提供大规模 GPU 算力,用于训练 AI 代码模型
埃隆·马斯克的 xAI 将为编程初创公司 Cursor 提供算力支持,利用数千台 GPU 来训练其新的代码模型。此举强化了 xAI 在计算服务领域的角色,可能提升收入,并在持续亏损的情况下应对运营成本问题。
GateNews1小时前