🚨 ANTHROPIC ÉTABLIT UNE NOUVELLE BASE DE RÉFÉRENCE AVEC CLAUDE OPUS 4.7


Cette version se concentre moins sur la performance brute et davantage sur la fiabilité et l'exécution.
Elle introduit des agents capables de fonctionner pendant des heures sans dériver, avec moins d'hallucinations et une calibration améliorée. La sécurité a également été renforcée, avec une meilleure résistance aux injections de prompts et aux tentatives de jailbreak.
Le modèle conserve une fenêtre de contexte de 1 million de tokens, mais montre désormais une récupération et un raisonnement plus efficaces sur de grandes entrées.
Une addition clé est « Routines ».
Ce sont des flux de travail persistants déclenchés par des API, des horaires ou des événements, permettant aux tâches de s'exécuter de manière autonome en arrière-plan.
VOICI LE CHANGEMENT :
L'IA passe de l'assistance à l'infrastructure.
64,3 % sur SWE-bench, contre 53,4 %
87,6 % sur la programmation agentique vérifiée
77,3 % sur l'utilisation d'outils à grande échelle
78,0 % sur les tâches informatiques du monde réel
Elle s'améliore également dans les domaines où les modèles se dégradent généralement :
79,3 % sur la recherche agentique
64,4 % sur l'analyse financière
91,5 % sur les questions-réponses multilingues
Et de manière critique, le raisonnement sur de longs contextes tient bon :
Plus de 90 % de raisonnement visuel avec des outils
94,2 % sur des benchmarks de niveau graduate
VOICI LA CONCLUSION :
Il ne s'agit pas de scores de pointe.
Il s'agit de cohérence dans tous les domaines.
Opus 4.7 ne domine pas dans toutes les catégories.
Mais il performe de manière fiable dans toutes.
C'est ce dont ont besoin les systèmes de production.
La frontière n'est plus seulement l'intelligence.
C'est la stabilité sous de véritables charges de travail.
Voir l'original
post-image
Cette page peut inclure du contenu de tiers fourni à des fins d'information uniquement. Gate ne garantit ni l'exactitude ni la validité de ces contenus, n’endosse pas les opinions exprimées, et ne fournit aucun conseil financier ou professionnel à travers ces informations. Voir la section Avertissement pour plus de détails.
  • Récompense
  • Commentaire
  • Reposter
  • Partager
Commentaire
Ajouter un commentaire
Ajouter un commentaire
Aucun commentaire
  • Épingler