Le GLM-5.2 de Zhipu atteint 22,8 % de précision sur ARC-AGI-2, rivalisant avec la version Light Reasoning de GPT-5.5.

Selon ARC Prize, le modèle GLM-5.2 de Zhipu a récemment obtenu une vérification officielle sur le benchmark ARC-AGI. Sur ARC-AGI-2, GLM-5.2 a atteint une précision de 22,8% avec un coût moyen de 0,25 dollar par tâche, tandis que sur le benchmark plus simple ARC-AGI-1, il a atteint 77,0% de précision pour 0,19 dollar par exécution.

Les performances globales de GLM-5.2 sont comparables à celles de GPT-5.4 et GPT-5.5 d'OpenAI en mode de raisonnement à faible effort. ARC-AGI est conçu pour évaluer les capacités de raisonnement de niveau AGI via des tâches abstraites de reconnaissance de motifs jamais vues lors de l'entraînement.

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.
Commentaire
0/400
Aucun commentaire