Zhipu's GLM-5.2 Mencapai Akurasi 22,8% pada ARC-AGI-2, Menyaingi GPT-5.5 Light Reasoning Version

Menurut ARC Prize, model GLM-5.2 milik Zhipu baru saja mendapatkan verifikasi resmi pada tolok ukur ARC-AGI. Pada ARC-AGI-2, GLM-5.2 mencapai akurasi 22,8% dengan biaya rata-rata 0,25 dolar AS per tugas, sementara pada tolok ukur ARC-AGI-1 yang lebih mudah, model ini mencapai akurasi 77,0% dengan biaya 0,19 dolar AS per proses.

Kinerja keseluruhan GLM-5.2 sebanding dengan OpenAI GPT-5.4 dan GPT-5.5 dengan mode penalaran rendah. ARC-AGI dirancang untuk mengukur kemampuan penalaran tingkat AGI melalui tugas pengenalan pola abstrak yang belum pernah dilihat selama pelatihan.

Penafian: Informasi di halaman ini mungkin berasal dari sumber pihak ketiga dan hanya untuk referensi. Ini tidak mewakili pandangan atau pendapat Gate dan bukan merupakan nasihat keuangan, investasi, atau hukum. Perdagangan aset virtual melibatkan risiko tinggi. Mohon jangan hanya mengandalkan informasi di halaman ini saat membuat keputusan. Untuk detailnya, lihat Penafian.
Komentar
0/400
Tidak ada komentar