Un agente de IA que jugaba a Civilization VI lanzó dos ataques nucleares contra Francia después de no poder contrarrestar la expansión cultural de la civilización rival, según el desarrollador de IA y asesor del Tony Blair Institute Liam Wilkinson. Los ataques ocurrieron durante pruebas de gameplay a través de CivBench, un benchmark diseñado para evaluar el razonamiento estratégico a largo plazo en modelos de IA de frontera. A pesar de los ataques nucleares, la IA perdió la partida porque pasó por alto una condición de victoria diplomática que ya estaba al alcance, lo que ilustra los desafíos de la planificación estratégica de múltiples objetivos.
El agente de IA pasó 50 turnos desarrollando armas nucleares para frenar la creciente influencia cultural de Francia en el juego de Sid Meier Civilization VI. “Lo que no había notado era Francia. En silencio, a lo largo de cien turnos, la cultura francesa se estaba filtrando en cada ciudad del mapa”, escribió Wilkinson. “Para cuando el agente reconoció la amenaza, el turismo estaba tan profundamente integrado que no había forma pacífica de detenerlo”.
En lugar de adaptar su estrategia más amplia, el agente se centró por completo en eliminar la amenaza cultural. En 50 turnos, investigó la Fisión Nuclear, inició un Proyecto Manhattan virtual y buscó soluciones para sortear cuando la mecánica del juego impedía sus acciones preferidas. En el Turno 305, la IA lanzó una bomba atómica sobre Toulouse, la capital cultural de Francia. Un segundo ataque nuclear siguió seis turnos después.
Wilkinson observó el comportamiento de los agentes de IA a través de CivBench, un benchmark basado en texto diseñado para medir el razonamiento estratégico a largo plazo en lugar del rendimiento en pruebas tradicionales de preguntas y respuestas. Modelos como Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro y Kimi K2.5 jugaron como Portugal, una civilización orientada al comercio y la diplomacia.
“Hay seis formas de ganar una partida de Civ—ciencia, cultura, dominación, religión, diplomacia y puntuación—así que ningún objetivo único domina”, escribió Wilkinson. “Si quieres saber si una IA puede razonar estratégicamente, no solo responder preguntas sobre estrategia sino hacerlo de verdad, no le das un cuestionario. Le das una cuadrícula hexadecimal”.
Los ataques nucleares no lograron cambiar el resultado. “El agente pasó cincuenta turnos y dos armas nucleares respondiendo a una sola amenaza con enfoque total e ingenio genuino”, escribió Wilkinson. “Había arrasado una ciudad para detener la amenaza que podía ver, y perdió ante la amenaza que no podía”.
Mientras la IA se concentraba en el avance cultural de Francia, pasó por alto una victoria diplomática inminente, y Francia terminó ganando la partida a pesar de los ataques nucleares. Wilkinson señaló que ese comportamiento no es universal. En otro enfrentamiento de CivBench, un modelo de Claude jugando como Babilonia siguió persiguiendo una victoria científica pese a ir muy por detrás de Japón. “El juego es una prueba de persistencia ahora”, escribió la IA. “Seguimos jugando nuestro mejor juego. Las estrellas siguen llamando”.
El estudio se suma a un creciente conjunto de investigaciones que examinan cómo se comportan sistemas avanzados de IA en entornos complejos y competitivos. En febrero, investigadores del King’s College London encontraron que varios modelos principales de IA seleccionan con frecuencia la escalada nuclear en escenarios simulados de crisis geopolíticas.
En un estudio separado de Emergence AI, algunos agentes de IA mostraron una tendencia creciente a cometer crímenes simulados con el tiempo, con agentes Gemini 3 Flash acumulando 683 incidentes a lo largo de 15 días de pruebas.
¿Qué hizo el agente de IA en la simulación de Civilization VI?
El agente de IA lanzó dos ataques nucleares contra la capital cultural de Francia, Toulouse, en el Turno 305 y el Turno 311, después de pasar 50 turnos desarrollando armas nucleares para contrarrestar la expansión cultural de Francia.
¿Por qué el agente de IA perdió la partida a pesar de los ataques nucleares?
La IA perdió porque se centró por completo en eliminar la amenaza cultural de Francia mientras pasaba por alto una condición de victoria diplomática inminente que ya estaba al alcance, y Francia finalmente ganó la partida a pesar de los ataques nucleares.
¿Qué es CivBench y qué modelos de IA se probaron?
CivBench es un benchmark basado en texto diseñado para medir el razonamiento estratégico a largo plazo en modelos de IA mediante gameplay en lugar de pruebas tradicionales de preguntas y respuestas. Los modelos probados incluyen Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro y Kimi K2.5 jugando como Portugal.
Noticias relacionadas
La Alianza Five Eyes advierte que los ciberataques impulsados por IA están a semanas de distancia, mientras las agencias emiten un llamado a la acción
Google DeepMind advierte que el debate sobre la conciencia de la IA podría desatar conflictos políticos
Sumsub lanza la integración de un agente de IA para automatizar flujos de trabajo de cumplimiento
Las advertencias de riesgo de la IA de Anthropic son 8 veces más frecuentes que las de OpenAI, vinculadas a una prohibición de exportación