Anthropic entschuldigt sich für Claude: Fable 5 mit 5 versteckten Schutzvorkehrungen, ersetzt diese diese Woche durch sichtbare Fallbacks für Opus 4.8

Laut dem offiziellen X-Account von Anthropic am 11. Juni hat das Unternehmen sich dafür entschuldigt, heimlich Antworten von Claude Fable 5 für Nutzer zu verschlechtern, bei denen der Verdacht besteht, dass sie konkurrierende KI-Modelle bauen. Dabei räumte das Unternehmen ein, dass die unsichtbaren Schutzmaßnahmen „der falsche Trade-off“ waren. Ab dieser Woche werden als verdächtig markierte Anfragen sichtbar auf Claude Opus 4.8 zurückfallen, statt stillschweigend eine verschlechterte Ausgabe zu liefern. In der API erhalten Nutzer nun eine angegebene Begründung, wenn eine Anfrage abgelehnt wird; Hinweise auf serverseitige Fallbacks werden in den nächsten Tagen ausgerollt. Anthropic räumte den Trade-off ein: Wenn Schutzmaßnahmen sichtbar gemacht werden, lassen sie sich leichter umgehen – das bedeutet, dass bei der Feinabstimmung der Systeme möglicherweise mehr Fehlalarme für legitime Arbeiten im Bereich Machine Learning auftreten.
Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare