Zhipu GLM-5.2 ครองอันดับ DeepSWE แบบโอเพนซอร์สด้วยอัตราความสำเร็จ 44% และทำผลงานได้ดีกว่าโมเดลปิดกระแสหลัก

2026-06-21 03:05:19

ตาม Beating (บัญชีติดตาม) โมเดลโอเพนซอร์สของ Zhipu AI อย่าง GLM-5.2 ทำผลงานได้สำเร็จสูงสุดในบรรดาโมเดลโอเพนซอร์สบนเกณฑ์ DeepSWE สำหรับงานวิศวกรรมซอฟต์แวร์ที่ซับซ้อน โดยมีอัตราความสำเร็จแบบครั้งเดียวถึง 44% ที่ความเข้มข้นการให้เหตุผลสูงสุด ทั้งนี้ทำได้เหนือกว่า Kimi K2.7 Code ที่อยู่ที่ 31% อยู่ 13 จุดเปอร์เซ็นต์

ที่ราคา 3.92 ดอลลาร์ต่อ 1 งาน GLM-5.2 ให้ประสิทธิภาพดีกว่าโมเดลปิดกระแสหลักหลายรุ่นภายใต้การตั้งค่าโหมดให้เหตุผลแบบเฉพาะเจาะจง รวมถึง Claude Sonnet 4.6 [high] ที่ 30%, Gemini 3.5 Flash [medium] ที่ 37% และ Claude Opus 4.8 [low] ที่ 41%

news.view.source

news.article.disclaimer

news.related.news

06-20 01:13

เปิดตัวโมเดลเรือธง GLM-5.2 ด้วยแชตบนเว็บบนแพลตฟอร์ม B.AI หลังการเปิดตัว API เมื่อวันที่ 18 มิถุนายน

06-19 09:14

นักพัฒนาชาวสหรัฐเร่งการนำโมเดล AI ของจีนมาใช้ โดย DeepSeek พุ่งขึ้นสู่สัดส่วน 17% ในเดือนพฤษภาคม

06-19 04:00

Zhipu AI's GLM-5.2 คว้ารองชนะเลิศใน Code Arena และทำคะแนน 51 ใน Artificial Analysis Index หลังเปิดตัว

06-17 09:47

GLM-5.2 ของ Zhipu ครองอันดับโมเดลโอเพนซอร์สสูงสุดในเกณฑ์ AA Benchmark ด้วย 51 คะแนน เทียบเท่า GPT-5.5 ในการทดสอบ GDPval

06-17 03:01