据 ARC Prize 消息,智谱 GLM-5.2 模型近期在 ARC-AGI 基准测试中通过官方验证。在 ARC-AGI-2 上,GLM-5.2 准确率达到 22.8%,每任务平均成本 0.25 美元;而在较简单的 ARC-AGI-1 基准上,其准确率为 77.0%,每次运行成本 0.19 美元。
GLM-5.2 的整体性能与 OpenAI 的 GPT-5.4 和 GPT-5.5(低推理努力模式)相当。ARC-AGI 旨在通过训练中从未见过的抽象模式识别任务来评估 AGI 级推理能力。
相关快讯
QCOM、AMAT、LRCX 受人工智能半导体乐观情绪推动在盘后交易中上涨
瑞银:中国 AI 模型成本比 OpenAI 低 90%,全球份额预计将上升
z.AI 的 GLM-5.2 模型以低成本高性能获得美国关注