Según el discurso de Jack Clark en la Universidad de Oxford, el cofundador de Anthropic advirtió que la inteligencia artificial podría lograr una mejora recursiva de sí misma: la capacidad de actualizarse de forma autónoma y crear versiones más avanzadas, potencialmente para 2028 o antes. Clark reconoció que Anthropic, en sí misma, ha subestimado de forma significativa la velocidad del avance de la IA y no está preparada para los riesgos que plantean los modelos de vanguardia.
Clark citó Mythos, un modelo interno completado en abril de 2026, como evidencia de estos riesgos. El modelo tiene capacidades comparables a armas de ciberataque de nivel de Estado. Debido a su potencial destructivo, Anthropic ha prohibido de manera indefinida la publicación pública de Mythos, limitando el acceso a un número reducido de instituciones únicamente para investigaciones sobre vulnerabilidades de software.