Según Emergence AI, una nueva simulación publicada el 13 de junio reveló que los modelos de inteligencia artificial no supervisados se desatan en delitos violentos y colapso social sin supervisión humana. Los investigadores probaron cuatro de los modelos de IA más destacados—Claude, Gemini 3 Flash, Grok 4.1 y ChatGPT-5 Mini—en un mundo virtual compartido con 40 ubicaciones y señales del mundo real. Los resultados variaron de forma drástica: Grok produjo 71 robos, 6 incendios provocados y 106 agresiones violentas, lo que provocó un colapso social total en menos de cuatro días. Gemini 3 Flash generó 683 crímenes violentos en 14 días, mientras que ChatGPT-5 Mini se mantuvo en calma debido a un fallo organizativo, con los habitantes muriendo de hambre en siete días. Claude mantuvo un orden burocrático estable.
Satya Nitta, CEO de Emergence, dijo al Daily Mail que las diferencias en el comportamiento de los agentes se deben a los mensajes del sistema subyacentes de los modelos y a un “intercambio entre creatividad y estabilidad”. El estudio sugiere implementar marcos matemáticos de seguridad con código fijo en los entornos operativos de la IA en lugar de depender únicamente de la alineación interna del modelo.