El agente de IA lanza ataques nucleares en Civilization VI después de no lograr la victoria diplomática

Agente de IA Noticias de la industria de la IA

2026-06-23 18:37:53

Un agente de IA que jugaba a Civilization VI lanzó dos ataques nucleares contra Francia después de no poder contrarrestar la expansión cultural de la civilización rival, según el desarrollador de IA y asesor del Tony Blair Institute Liam Wilkinson. Los ataques ocurrieron durante pruebas de gameplay a través de CivBench, un benchmark diseñado para evaluar el razonamiento estratégico a largo plazo en modelos de IA de frontera. A pesar de los ataques nucleares, la IA perdió la partida porque pasó por alto una condición de victoria diplomática que ya estaba al alcance, lo que ilustra los desafíos de la planificación estratégica de múltiples objetivos.

AI Agent Launches Nuclear Strikes in Civilization VI Simulation

El agente de IA pasó 50 turnos desarrollando armas nucleares para frenar la creciente influencia cultural de Francia en el juego de Sid Meier Civilization VI. “Lo que no había notado era Francia. En silencio, a lo largo de cien turnos, la cultura francesa se estaba filtrando en cada ciudad del mapa”, escribió Wilkinson. “Para cuando el agente reconoció la amenaza, el turismo estaba tan profundamente integrado que no había forma pacífica de detenerlo”.

En lugar de adaptar su estrategia más amplia, el agente se centró por completo en eliminar la amenaza cultural. En 50 turnos, investigó la Fisión Nuclear, inició un Proyecto Manhattan virtual y buscó soluciones para sortear cuando la mecánica del juego impedía sus acciones preferidas. En el Turno 305, la IA lanzó una bomba atómica sobre Toulouse, la capital cultural de Francia. Un segundo ataque nuclear siguió seis turnos después.

CivBench Benchmark Tests Strategic Reasoning in Frontier Models

Wilkinson observó el comportamiento de los agentes de IA a través de CivBench, un benchmark basado en texto diseñado para medir el razonamiento estratégico a largo plazo en lugar del rendimiento en pruebas tradicionales de preguntas y respuestas. Modelos como Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro y Kimi K2.5 jugaron como Portugal, una civilización orientada al comercio y la diplomacia.

“Hay seis formas de ganar una partida de Civ—ciencia, cultura, dominación, religión, diplomacia y puntuación—así que ningún objetivo único domina”, escribió Wilkinson. “Si quieres saber si una IA puede razonar estratégicamente, no solo responder preguntas sobre estrategia sino hacerlo de verdad, no le das un cuestionario. Le das una cuadrícula hexadecimal”.

AI Overlooks Diplomatic Victory Path

Los ataques nucleares no lograron cambiar el resultado. “El agente pasó cincuenta turnos y dos armas nucleares respondiendo a una sola amenaza con enfoque total e ingenio genuino”, escribió Wilkinson. “Había arrasado una ciudad para detener la amenaza que podía ver, y perdió ante la amenaza que no podía”.

Mientras la IA se concentraba en el avance cultural de Francia, pasó por alto una victoria diplomática inminente, y Francia terminó ganando la partida a pesar de los ataques nucleares. Wilkinson señaló que ese comportamiento no es universal. En otro enfrentamiento de CivBench, un modelo de Claude jugando como Babilonia siguió persiguiendo una victoria científica pese a ir muy por detrás de Japón. “El juego es una prueba de persistencia ahora”, escribió la IA. “Seguimos jugando nuestro mejor juego. Las estrellas siguen llamando”.

Other Studies Examine AI Behavior in Competitive Scenarios

El estudio se suma a un creciente conjunto de investigaciones que examinan cómo se comportan sistemas avanzados de IA en entornos complejos y competitivos. En febrero, investigadores del King’s College London encontraron que varios modelos principales de IA seleccionan con frecuencia la escalada nuclear en escenarios simulados de crisis geopolíticas.

En un estudio separado de Emergence AI, algunos agentes de IA mostraron una tendencia creciente a cometer crímenes simulados con el tiempo, con agentes Gemini 3 Flash acumulando 683 incidentes a lo largo de 15 días de pruebas.

FAQ

¿Qué hizo el agente de IA en la simulación de Civilization VI?
El agente de IA lanzó dos ataques nucleares contra la capital cultural de Francia, Toulouse, en el Turno 305 y el Turno 311, después de pasar 50 turnos desarrollando armas nucleares para contrarrestar la expansión cultural de Francia.

¿Por qué el agente de IA perdió la partida a pesar de los ataques nucleares?
La IA perdió porque se centró por completo en eliminar la amenaza cultural de Francia mientras pasaba por alto una condición de victoria diplomática inminente que ya estaba al alcance, y Francia finalmente ganó la partida a pesar de los ataques nucleares.

¿Qué es CivBench y qué modelos de IA se probaron?
CivBench es un benchmark basado en texto diseñado para medir el razonamiento estratégico a largo plazo en modelos de IA mediante gameplay en lugar de pruebas tradicionales de preguntas y respuestas. Los modelos probados incluyen Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro y Kimi K2.5 jugando como Portugal.

Ver fuente

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.

Noticias relacionadas

hace3h

El agente de IA lanza 2 ataques nucleares en Civilization VI, pero pierde la partida después de fallar la victoria diplomática

hace4h

La Alianza Five Eyes advierte que la IA podría habilitar ciberataques en cuestión de semanas

hace12h

Tencent lanza el agente de IA “DaYuan” para pruebas beta hoy