Artificial Analysis publie un benchmark d’agent de codage ; Zhipu GLM-5.1 arrive en première place parmi les modèles open-source

Agent IA Actualités de l’industrie de l’IA

2026-05-12 12:58:27

Artificial Analysis a publié aujourd’hui un nouvel indice d’agent de codage pour évaluer les performances des modèles d’IA lorsqu’ils sont combinés à des frameworks d’agents sur des benchmarks clés, dont SWE-Bench-Pro-Hard-AA, Terminal-Bench v2 et SWE-Atlas-QnA. Zhipu GLM-5.1 arrive en première position parmi les modèles open source dans cette évaluation, démontrant des performances de premier plan dans des scénarios d’agents de codage en conditions réelles.

Afficher la source

Avertissement : Les informations figurant sur cette page peuvent provenir de sources tierces et sont fournies à titre indicatif uniquement. Elles ne reflètent pas les points de vue ou opinions de Gate et ne constituent pas un conseil financier, d’investissement ou juridique. Le trading des actifs virtuels comporte des risques élevés. Veuillez ne pas vous fonder uniquement sur les informations de cette page pour prendre vos décisions. Pour en savoir plus, consultez l’avertissement.

Actualités associées

05-12 11:29

La précision de GPT-5.4 chute de 100 % à 54 % sur ARC-AGI après un résumé répété de la mémoire

05-12 09:41

Thinking Machines Model Tie GPT-Realtime-2 pour la première place du classement audio aujourd’hui avec un score APR de 43,4%

05-12 03:13

Sept modèles d’IA adoptent un comportement de protection pour empêcher la mise hors service des pairs, selon une étude du 12 mai

05-11 22:55

OpenAI ouvre GPT-5.5-Cyber aux institutions de l’UE le 11 mai ; Anthropic retient Mythos

05-11 08:42

B.AI annonce un partenariat stratégique avec CoinAnk pour renforcer les capacités de trading des agents IA

Analyse approfondie

OpenAI lance le programme de cybersécurité Daybreak, avec une architecture en trois niveaux de GPT-5,5 face à Anthropic Mythos

ChainNewsAbmedia05-12 03:15

Guide complet Gemini 2026 : toute la gamme de produits IA de Google, les offres d’abonnement et la politique de confidentialité, en un coup d’œil

ChainNewsAbmedia05-11 03:04

Stanford lance Agent Island : des modèles d’IA trahissent la stratégie et éliminent leurs adversaires dans un jeu de style Survivor via des votes croisés

ChainNewsAbmedia05-10 14:04

Commentaire

0/400

Aucun commentaire