Message de Gate News, 23 avril — L’équipe d’ingénierie d’Anthropic a confirmé que la dégradation de la qualité de Claude Code signalée par les utilisateurs au cours du mois écoulé provenait de trois changements indépendants au niveau de la couche produit, et non de problèmes liés à l’API ou au modèle sous-jacent. Les trois problèmes ont été corrigés respectivement les 7 avril, 10 avril et 20 avril, avec désormais une version finale en v2.1.116.
Le premier changement est intervenu le 4 mars, lorsque l’équipe a abaissé le niveau d’effort de raisonnement par défaut pour Claude Code de “high” à “medium” afin de traiter des pics de latence extrêmes occasionnels dans Opus 4.6 lorsque l’intensité de raisonnement est élevée. Après de nombreuses plaintes d’utilisateurs concernant une baisse des performances, l’équipe a annulé le changement le 7 avril. Le paramètre par défaut actuel est désormais “xhigh” pour Opus 4.7 et “high” pour les autres modèles.
Le second problème était un bug introduit le 26 mars. Le système était conçu pour effacer d’anciens enregistrements de raisonnement après que l’inactivité de la conversation dépassait une heure afin de réduire les coûts de récupération de session. Toutefois, une erreur dans l’implémentation a fait que l’effacement s’exécutait à répétition à chaque tour ultérieur, au lieu de s’exécuter une seule fois, ce qui a entraîné une perte progressive du contexte de raisonnement antérieur. Cela s’est manifesté par une augmentation de l’oubli, des opérations répétées et des invocations d’outils anormales. Le bug a également entraîné des ratés de cache à chaque requête, accélérant la consommation des quotas des utilisateurs. Deux expériences internes sans lien ont masqué les conditions de reproduction, prolongeant le processus de débogage à plus d’une semaine. Après la correction intervenue le 10 avril, l’équipe a examiné le code problématique à l’aide d’Opus 4.7 et a constaté qu’Opus 4.7 pouvait identifier le bug, contrairement à Opus 4.6.
Le troisième changement a été lancé le 16 avril en même temps que Opus 4.7. L’équipe a ajouté des instructions au prompt système pour réduire la sortie redondante. Les tests internes menés sur plusieurs semaines n’ont montré aucune régression, mais après le lancement, les interactions avec d’autres prompts ont dégradé la qualité du codage. Une évaluation prolongée a révélé une baisse de 3 % des performances pour Opus 4.6 et 4.7, entraînant un rollback le 20 avril.
Ces trois changements ont touché différents groupes d’utilisateurs à des moments différents, et leur effet combiné a entraîné une baisse de qualité généralisée et incohérente, compliquant le diagnostic. Anthropic a indiqué qu’elle exigera désormais que davantage d’employés internes utilisent la même version de build publique que les utilisateurs, qu’ils exécutent des suites complètes d’évaluation du modèle pour chaque modification de prompt système et qu’ils mettent en œuvre des périodes de déploiement progressif. En guise de compensation, Anthropic a réinitialisé les quotas d’utilisation pour tous les utilisateurs disposant d’un abonnement.
Articles similaires
Meta Platforms prévoit une réduction de 10 % de ses effectifs le 20 mai, affectant environ 8 000 postes
Le gouvernement Trump publie un plan visant à lutter contre le raffinage de l’IA, accusant des entreprises chinoises de voler systématiquement les capacités des modèles
DeepSeek lance une version d’aperçu open source V4, avec une note technique de 3206 dépassant GPT-5.4
Cambricon finalise l’adaptation Day 0 de DeepSeek-V4, une étape majeure pour l’écosystème de puces IA de la Chine
Tencent lance Hy3 en version d’aperçu open source, les tests de référence du code améliorent de 40 % par rapport à l’ancienne version
Les investissements de portefeuille de FTX d’une valeur de 158 000 milliards de won s’ils n’avaient pas fait faillite