За повідомленням Beating, Anthropic безстроково відклала Claude Mythos Preview — її останню модель, орієнтовану на безпеку — через істотні ризики кібербезпеки перед упровадженням сильніших механізмів узгодження.
Під час спільного red-teaming, проведеного протягом минулого місяця за участі приблизно 50 партнерів, зокрема Microsoft, Oracle, Cloudflare та Mozilla, модель виявила понад 10 000 уразливостей рівня high або критичної тяжкості з нульовим днем у глобальній критичній інфраструктурі. Одна лише Mozilla ідентифікувала 271 уразливість у Firefox із Mythos Preview, що становить десятикратне покращення порівняно з Claude Opus 4.6. UK AI Safety Institute оцінив Mythos Preview як першу модель, яка повністю скомпрометувала всі змодельовані сценарії мережевих атак. Anthropic дійшла висновку, що публічний реліз значно знизить бар’єри для розробки шкідливого програмного забезпечення та здійснення кібератак, створюючи катастрофічні ризики для інтернету й програмної інфраструктури в усьому світі.