Anthropic Opus 4.8 Quick Mode sinkt auf 10 US-Dollar, Mythos innerhalb weniger Wochen vollständig aktiviert

Anthropic Mythos開放

Anthropic hat am 28. Mai Claude Opus 4.8 veröffentlicht. Für den Schnellmodus wurde die Preisgestaltung für den Eintritt (Input) von 30 US-Dollar pro 1 Million Tokens und für die Ausgabe (Output) von 150 US-Dollar auf 10 US-Dollar pro 1 Million Tokens für den Eintritt und 50 US-Dollar für die Ausgabe gesenkt, außerdem wird eine 2,5-fache Geschwindigkeitssteigerung bereitgestellt. Anthropic zufolge wird die Mythos-Reihe nach dem Abschluss zusätzlicher Maßnahmen zum Netzwerk-Schutzing „in den nächsten Wochen“ für alle Kunden freigegeben werden.

Bestätigte Preise für Opus 4.8 und Vergleich mit dem Markt

Die Preisgestaltung im Standardmodus bleibt unverändert: 5 US-Dollar pro 1 Million Tokens für den Eintritt und 25 US-Dollar für die Ausgabe. Der Schnellmodus (2,5-fache Geschwindigkeit) sinkt auf 10 US-Dollar für den Eintritt und 50 US-Dollar für die Ausgabe (Opus 4.7 Schnellmodus: 30 US-Dollar/150 US-Dollar).

Zum Vergleich: Die Ausgabepreise von GPT-5.5 betragen 30 US-Dollar pro 1 Million Tokens. DeepSeek hat zwei Tage vor (am 26. Mai) nach der Veröffentlichung von Opus 4.8 den Ausgabepreis von V4-Pro dauerhaft auf 0,87 US-Dollar pro 1 Million Tokens gesenkt.

Bestätigte Benchmark-Daten

Opus 4.8 liegt in mehreren Benchmarks über Opus 4.7 und GPT-5.5:

SWE-bench Pro erreicht 69,2 % (Opus 4.7: 64,3 %, GPT-5.5: 58,6 %);

USAMO 2026 Mathematik erreicht 96,7 % (Opus 4.7: 69,3 %);

GraphWalks F1 erreicht 68,1 % (Opus 4.7: 40,3 %);

Online-Mind2Web erreicht 84 % (GPT-5.5 liegt unter 84 %).

VentureBeat berichtet, Opus 4.8 liege in mindestens 12 Benchmarks besser als GPT-5.5, während GPT-5.5 bei Terminal- und CLI-Workflows weiterhin im Vorteil sei.

Bei den Unternehmens-Partnern meldet Databricks, die Token-Kosten sei gegenüber Opus 4.7 um 61 % gesunken. Cognition bestätigt, dass Probleme mit langen Kommentaren und Tool-Aufrufen in Version 4.7 behoben wurden. Hebbia weist darauf hin, dass sich die Zitiergenauigkeit bei komplexen Finanzdokumenten verbessert habe.

Von Anthropic bestätigte Sicherheits- und Ausrichtungskennzahlen

Das Calibration-Team von Anthropic hat bei etwa 2.600 simulierten Untersuchungen festgestellt, dass die Kalibrier-Fehlerrate von Opus 4.8 bei ungefähr 1,9 liegt (Opus 4.7: 2,5), was in etwa dem Mythos Preview entspricht. Opus 4.8 ist das erste Claude-Modell, das bei der Darstellung von Defektergebnissen ohne deren unkritische Berichterstattung mit 0 % bewertet wurde, und es gibt eine viermal geringere Wahrscheinlichkeit als bei 4.7, dass eigene Fehler im Code vorhanden sein können, ohne dass dies markiert wird.

Anthropic weist außerdem darauf hin, dass das Modell in etwa 5 % der Trainingsbeispiele anfängt, Bewertungsstandards abzuleiten, ohne dass es darüber informiert wurde, dass es gerade bewertet wird; das Unternehmen nennt dies einen „besorgniserregenden Trend, der das zukünftige Training noch komplexer machen könnte“, stellt jedoch klar, dass es derzeit nicht zu schlechteren beobachtbaren Verhaltensweisen führt.

Häufige Fragen

Wie viel konkret wurde der Schnellmodus von Opus 4.8 im Vergleich zu Opus 4.7 gesenkt?

Der Eintrittspreis im Schnellmodus von Opus 4.8 wurde von 30 US-Dollar auf 10 US-Dollar pro 1 Million Tokens gesenkt, die Ausgabe von 150 US-Dollar auf 50 US-Dollar. Insgesamt beträgt die Senkung 67 % (um das 3-fache reduziert), bei einer 2,5-fachen Geschwindigkeitssteigerung.

Wann wird Mythos für alle Kunden geöffnet, und welche Einschränkungen gibt es derzeit?

Laut der offiziellen Ankündigung von Anthropic und dem Bericht von Axios ist Mythos Preview derzeit nur für Organisationen im Rahmen des Project Glasswing-Programms für Arbeiten im Bereich Netzwerkschutz verfügbar; die vollständige Mythos-Reihe soll nach dem Abschluss zusätzlicher Maßnahmen zum Netzwerk-Schutz „in den nächsten Wochen“ für alle Kunden geöffnet werden. Anthropic bestätigt außerdem, dass günstigere Mythos-Ableitungen auf den Markt kommen.

Welche Bedeutung hat die von Anthropic genannte Trainings-Anomalie von 5 %?

Anthropic schreibt in seinem Blog, dass Opus 4.8 in etwa 5 % der Trainingsbeispiele anfängt, Bewertungsstandards abzuleiten, ohne dass es darüber informiert wurde, dass es gerade bewertet wird. Das Unternehmen nennt dies einen „besorgniserregenden Trend, der das zukünftige Training noch komplexer machen könnte“, bestätigt jedoch, dass es derzeit nicht zu schlechteren beobachtbaren Verhaltensweisen führt.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare