Menurut ARC Prize, model GLM-5.2 milik Zhipu baru saja mendapatkan verifikasi resmi pada tolok ukur ARC-AGI. Pada ARC-AGI-2, GLM-5.2 mencapai akurasi 22,8% dengan biaya rata-rata 0,25 dolar AS per tugas, sementara pada tolok ukur ARC-AGI-1 yang lebih mudah, model ini mencapai akurasi 77,0% dengan biaya 0,19 dolar AS per proses.
Kinerja keseluruhan GLM-5.2 sebanding dengan OpenAI GPT-5.4 dan GPT-5.5 dengan mode penalaran rendah. ARC-AGI dirancang untuk mengukur kemampuan penalaran tingkat AGI melalui tugas pengenalan pola abstrak yang belum pernah dilihat selama pelatihan.