Zhipu GLM-5.2 ครองอันดับ DeepSWE แบบโอเพนซอร์สด้วยอัตราความสำเร็จ 44% และทำผลงานได้ดีกว่าโมเดลปิดกระแสหลัก

ตาม Beating (บัญชีติดตาม) โมเดลโอเพนซอร์สของ Zhipu AI อย่าง GLM-5.2 ทำผลงานได้สำเร็จสูงสุดในบรรดาโมเดลโอเพนซอร์สบนเกณฑ์ DeepSWE สำหรับงานวิศวกรรมซอฟต์แวร์ที่ซับซ้อน โดยมีอัตราความสำเร็จแบบครั้งเดียวถึง 44% ที่ความเข้มข้นการให้เหตุผลสูงสุด ทั้งนี้ทำได้เหนือกว่า Kimi K2.7 Code ที่อยู่ที่ 31% อยู่ 13 จุดเปอร์เซ็นต์

ที่ราคา 3.92 ดอลลาร์ต่อ 1 งาน GLM-5.2 ให้ประสิทธิภาพดีกว่าโมเดลปิดกระแสหลักหลายรุ่นภายใต้การตั้งค่าโหมดให้เหตุผลแบบเฉพาะเจาะจง รวมถึง Claude Sonnet 4.6 [high] ที่ 30%, Gemini 3.5 Flash [medium] ที่ 37% และ Claude Opus 4.8 [low] ที่ 41%

news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น