Le GLM-5.2 de Zhipu atteint 22,8 % de précision sur ARC-AGI-2, rivalisant avec la version Light Reasoning de GPT-5.5.

2026-06-25 10:37:31

Selon ARC Prize, le modèle GLM-5.2 de Zhipu a récemment obtenu une vérification officielle sur le benchmark ARC-AGI. Sur ARC-AGI-2, GLM-5.2 a atteint une précision de 22,8% avec un coût moyen de 0,25 dollar par tâche, tandis que sur le benchmark plus simple ARC-AGI-1, il a atteint 77,0% de précision pour 0,19 dollar par exécution.

Les performances globales de GLM-5.2 sont comparables à celles de GPT-5.4 et GPT-5.5 d'OpenAI en mode de raisonnement à faible effort. ARC-AGI est conçu pour évaluer les capacités de raisonnement de niveau AGI via des tâches abstraites de reconnaissance de motifs jamais vues lors de l'entraînement.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

Il y a 2h

WeRide GENESIS remporte le prix Best Gen-AI Solution Award dans le contexte de l'expansion mondiale de la conduite autonome.

Il y a 9h

OpenAI met à jour GPT-5.5 Instant avec des capacités de ton adaptatif, déploiement d'abord pour les utilisateurs payants.

Il y a 10h

OpenAI lance GPT-5.5 Instant mondialement à tous les utilisateurs gratuits le 26 juin.

06-23 19:02

Le GPT-5.5-Cyber d’OpenAI atteint 85,6 % sur le benchmark CyberGym et dépasse le modèle Banned Mythos d’Anthropic

06-23 08:51

La z.AI de Chine lance le modèle GLM-5.2, en surpassant GPT-5.5 le 16 juin avec un coût d’API inférieur d’un sixième

Analyse approfondie