GLM-5.2 ของ Zhipu ทำความแม่นยำ 22.8% บน ARC-AGI-2 เทียบเท่ารุ่น GPT-5.5 Light Reasoning

2026-06-25 10:37:31

ตามข้อมูลของ ARC Prize โมเดล GLM-5.2 ของ Zhipu เพิ่งได้รับการตรวจสอบอย่างเป็นทางการบนเกณฑ์มาตรฐาน ARC-AGI บน ARC-AGI-2 GLM-5.2 มีความแม่นยำ 22.8% โดยมีต้นทุนเฉลี่ย 0.25 ดอลลาร์ต่อภารกิจ ขณะที่บนเกณฑ์มาตรฐาน ARC-AGI-1 ที่ง่ายกว่า มีความแม่นยำ 77.0% ที่ต้นทุน 0.19 ดอลลาร์ต่อการรัน

ประสิทธิภาพโดยรวมของ GLM-5.2 เทียบได้กับ GPT-5.4 และ GPT-5.5 ของ OpenAI ในโหมดการใช้การให้เหตุผลต่ำ ARC-AGI ถูกออกแบบมาเพื่อประเมินความสามารถในการให้เหตุผลระดับ AGI ผ่านงานการจดจำรูปแบบนามธรรมที่ไม่เคยเห็นระหว่างการฝึก

news.view.source

news.article.disclaimer

news.related.news

7 ชั่วโมง ที่แล้ว

WeRide GENESIS คว้ารางวัลโซลูชัน Gen-AI ยอดเยี่ยม ท่ามกลางการขยายตัวของอุตสาหกรรมขับขี่อัตโนมัติทั่วโลก

14 ชั่วโมง ที่แล้ว

OpenAI อัปเดต GPT-5.5 Instant ด้วยความสามารถในการปรับโทนเสียงอัตโนมัติ เปิดให้ผู้ใช้ที่ชำระเงินก่อน

15 ชั่วโมง ที่แล้ว

OpenAI เปิดตัว GPT-5.5 Instant ทั่วโลกให้ผู้ใช้ฟรีทุกคนในวันที่ 26 มิถุนายน

06-23 19:02

GPT-5.5-Cyber ของ OpenAI ทำคะแนน 85.6% บนเกณฑ์วัด CyberGym แซงหน้ารุ่น Banned Mythos ของ Anthropic

06-23 08:51