El GLM-5.2 de Zhipu logra un 22,8% de precisión en ARC-AGI-2, rivaliza con GPT-5.5 Light Reasoning Version

Según ARC Prize, el modelo GLM-5.2 de Zhipu logró recientemente una verificación oficial en el benchmark ARC-AGI. En ARC-AGI-2, GLM-5.2 alcanzó una precisión del 22,8% con un costo promedio de 0,25 dólares por tarea, mientras que en el benchmark más fácil ARC-AGI-1, logró una precisión del 77,0% a 0,19 dólares por ejecución.

El rendimiento general de GLM-5.2 es comparable al de GPT-5.4 y GPT-5.5 de OpenAI con modo de razonamiento de bajo esfuerzo. ARC-AGI está diseñado para evaluar capacidades de razonamiento a nivel AGI a través de tareas abstractas de reconocimiento de patrones nunca antes vistas durante el entrenamiento.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios