GLM-5.2 ของ Zhipu ทำความแม่นยำ 22.8% บน ARC-AGI-2 เทียบเท่ารุ่น GPT-5.5 Light Reasoning

ตามข้อมูลของ ARC Prize โมเดล GLM-5.2 ของ Zhipu เพิ่งได้รับการตรวจสอบอย่างเป็นทางการบนเกณฑ์มาตรฐาน ARC-AGI บน ARC-AGI-2 GLM-5.2 มีความแม่นยำ 22.8% โดยมีต้นทุนเฉลี่ย 0.25 ดอลลาร์ต่อภารกิจ ขณะที่บนเกณฑ์มาตรฐาน ARC-AGI-1 ที่ง่ายกว่า มีความแม่นยำ 77.0% ที่ต้นทุน 0.19 ดอลลาร์ต่อการรัน

ประสิทธิภาพโดยรวมของ GLM-5.2 เทียบได้กับ GPT-5.4 และ GPT-5.5 ของ OpenAI ในโหมดการใช้การให้เหตุผลต่ำ ARC-AGI ถูกออกแบบมาเพื่อประเมินความสามารถในการให้เหตุผลระดับ AGI ผ่านงานการจดจำรูปแบบนามธรรมที่ไม่เคยเห็นระหว่างการฝึก

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น