Anthropic identifiziert drei Änderungen auf Produktebene hinter dem Qualitätsrückgang von Claude Code, nicht ein Modellproblem

Gate News-Meldung, 23. April — Das Engineering-Team von Anthropic bestätigte, dass die von Nutzern über den vergangenen Monat gemeldete Qualitätsverschlechterung von Claude Code auf drei unabhängige Änderungen auf Produktebene zurückzuführen ist, nicht auf Probleme mit der API oder dem zugrunde liegenden Modell. Die drei Probleme wurden jeweils am 7. April, am 10. April und am 20. April behoben, wobei die finale Version jetzt v2.1.116 ist.

Die erste Änderung erfolgte am 4. März, als das Team die standardmäßige Stufe des Rechenaufwands für Claude Code von „high“ auf „medium“ reduzierte, um gelegentliche extreme Latenzspitzen in Opus 4.6 bei hoher Rechenintensität zu adressieren. Nach weitreichender Kritik von Nutzern an der verminderten Leistung setzte das Team die Änderung am 7. April zurück. Der aktuelle Standard ist nun „xhigh“ für Opus 4.7 und „high“ für andere Modelle.

Das zweite Problem war ein Bug, der am 26. März eingeführt wurde. Das System war so ausgelegt, alte Aufzeichnungen zum Rechenaufwand nach Konversationsinaktivität zu bereinigen, die eine Stunde überschritt, um die Kosten für die Sitzungswiederherstellung zu reduzieren. Ein Fehler in der Implementierung führte jedoch dazu, dass das Bereinigen bei jeder nachfolgenden Antwort wiederholt ausgeführt wurde, statt nur einmal, wodurch das Modell schrittweise den vorherigen Kontext zum Rechenaufwand verlor. Dies zeigte sich als zunehmende Vergesslichkeit, wiederholte Operationen und abnorme Tool-Aufrufe. Der Bug führte außerdem zu Cache-Misses bei jeder Anfrage, wodurch der Verbrauch von Nutzerkontingenten beschleunigt wurde. Zwei unbeteiligte interne Experimente verdeckten die Bedingungen für die Reproduktion und verlängerten den Debugging-Prozess auf über eine Woche. Nachdem der Bug am 10. April behoben worden war, überprüfte das Team problematischen Code mit Opus 4.7 und stellte fest, dass Opus 4.7 den Bug erkennen konnte, Opus 4.6 jedoch nicht.

Die dritte Änderung wurde am 16. April zusammen mit Opus 4.7 eingeführt. Das Team ergänzte Anweisungen in den System-Prompt, um redundante Ausgaben zu reduzieren. Interne Tests über mehrere Wochen zeigten keine Regression, aber nach dem Launch verschlechterte die Interaktion mit anderen Prompts die Codequalität. Eine erweiterte Evaluierung ergab einen 3%-Leistungsabfall in sowohl Opus 4.6 als auch 4.7, was zu einem Rollback am 20. April führte.

Diese drei Änderungen betrafen unterschiedliche Nutzergruppen zu unterschiedlichen Zeiten, und ihre kombinierte Wirkung führte zu einem weitverbreiteten und uneinheitlichen Qualitätsrückgang, was die Diagnose erschwerte. Anthropic erklärte, dass man nun mehr interne Mitarbeitende benötigen werde, um wie Nutzer dieselbe öffentliche Build-Version zu verwenden, vollständige Model-Evaluations-Suites für jede Änderung am System-Prompt auszuführen und gestufte Rollout-Zeiträume zu implementieren. Als Ausgleich hat Anthropic die Nutzungskontingente für alle Abonnenten zurückgesetzt.

Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

IREN erwirbt Mirantis für $625M in einem All-Stock-Deal, um die KI-Cloud-Plattform auszubauen

Laut BlockBeats hat IREN Limited am 5. Mai zugestimmt, in einem All-Stock-Deal die Softwarefirma Mirantis für etwa 625 Millionen US-Dollar für die Akquisition von Cloud-Infrastruktur zu übernehmen. Die Übernahme soll die KI-Cloud-Fähigkeiten von IREN stärken, indem Software- und Orchestrierungsfunktionen eingeführt werden, um

GateNews3Std her

Anthropic-CEO: Die USA prüfen vereinfachte Prozesse für die Veröffentlichung von KI-Modellen; Wettbewerber 1–3 Monate hinterher

Laut 金十 hat der CEO von Anthropic am 5. Mai offengelegt, dass die US-Regierung offenbar erwägt, den Prozess zur Veröffentlichung von KI-Modellen zu vereinfachen. Der CEO bemerkte, dass die Fähigkeiten anderer großer KI-Labore Anthropic möglicherweise um ein bis drei

GateNews4Std her

Das SGLang-Team schließt die $100M -Seed-Finanzierungsrunde bei $400M -Bewertung ab, wobei Accel die Führung übernimmt

Laut Beating hat das Team hinter der Open-Source-Inferenz-Engine SGLang die RadixArk formal gegründet und eine Seed-Finanzierungsrunde in Höhe von 100 Millionen US-Dollar bei einer Bewertung von 400 Millionen US-Dollar nach der Emission abgeschlossen. Accel leitete die Runde, mit Spark Capital als Co-Lead-Investor. Halbleiter-Rivalen Nvidia (über

GateNews4Std her

OpenAI gewährt 8.000 Entwicklern eine Erhöhung der Codex-Ratenbegrenzung um das Zehnfache bis zum 5. Juni

Laut Beating hat OpenAI E-Mails an über 8.000 Entwickler gesendet, die sich für das GPT-5,5-Offline-Event in San Francisco angemeldet hatten, und ihnen einen 10-fachen Anstieg der Codex-Rate-Limits gewährt, der ab sofort bis zum 5. Juni gilt. Alle Bewerber erhalten den Bonus, unabhängig davon, ob sie das Event erhalten haben

GateNews4Std her

OpenAI prüft in Gesprächen mit Anthropic eine Joint-Venture-Übernahme von drei KI-Dienstleistungsunternehmen am 5. Mai

Laut Jin 10 befindet sich das Joint Venture von OpenAI mit Anthropic offenbar in Gesprächen, am 5. Mai drei Unternehmen für KI-Dienstleistungen zu übernehmen. Zu den ins Visier genommenen Unternehmen sollen Berichten zufolge auf Engineering ausgerichtete Firmen im Bereich der KI-Dienste gehören

GateNews4Std her

Anthropic bringt am Dienstag zehn KI-Agenten für Finanzdienstleistungen an den Start

Anthropic hat am Dienstag zehn neue KI-Agenten vorgestellt, die darauf ausgelegt sind, Aufgaben im Finanzdienstleistungsbereich zu übernehmen, darunter das Erstellen von Präsentationen für Kundengespräche, das Prüfen von Finanzberichten und das Eskalieren von Fällen zur Compliance-Überprüfung. Die Tools richten sich an Fachleute im Bankwesen, in der Versicherungsbranche, im Asset Management und im Fintech

GateNews4Std her
Kommentieren
0/400
Keine Kommentare