Lors d’un discours de Jack Clark à l’Université d’Oxford, le cofondateur d’Anthropic a averti que l’intelligence artificielle pourrait atteindre une amélioration récursive de soi, c’est-à-dire la capacité de s’améliorer de manière autonome et de créer des versions plus avancées—potentiellement d’ici 2028 ou plus tôt. Clark a reconnu qu’Anthropic elle-même a considérablement sous-estimé la vitesse des progrès de l’IA et qu’elle n’est pas suffisamment préparée aux risques posés par les modèles les plus avancés.
Clark a cité Mythos, un modèle interne finalisé en avril 2026, comme preuve de ces risques. Le modèle possède des capacités comparables à des armes de cyberattaque au niveau d’un État. En raison de son potentiel destructeur, Anthropic a banni indéfiniment la publication publique de Mythos, en limitant l’accès à un nombre restreint d’institutions pour des recherches uniquement sur les vulnérabilités logicielles.