GLM 5.2 ลดต้นทุนการทำซ้ำเอกสารวิชาการเหลือ 1 ใน 8 ของ Claude Opus 4.8 Max

จากข้อมูลของ Beating ในการทดสอบการสร้างซ้ำทางวิชาการ GLM 5.2 มีต้นทุนเพียง 6.21 ดอลลาร์ ในขณะที่ Claude Opus 4.8 Max ใช้ 46.35 ดอลลาร์ เมื่อทำการจำลองเอกสารวิจัยเกี่ยวกับการเรียนรู้แบบเสริมกำลังแบบกลั่นตนเอง โมเดลโอเพนซอร์สต้องลองล้มเหลว 14 ครั้งก่อนจะสำเร็จ โดยใช้โทเคน 2.65 ล้านโทเคน ในขณะที่ Opus ทำงานสำเร็จหลังจากล้มเหลว 9 ครั้ง โดยใช้โทเคน 4.53 ล้านโทเคน ตามการทดสอบเอเจนต์อัตโนมัติของทีม alphaXiv
news.article.disclaimer
แสดงความคิดเห็น
0/400
ไม่มีความคิดเห็น