ИИ-агент запускает ядерные удары в Civilization VI после провала дипломатической победы

AI-агент, игравший в Civilization VI, нанес два ядерных удара по Франции после того, как не смог противостоять культурной экспансии соперничающей цивилизации, сообщает разработчик ИИ и советник Tony Blair Institute Лиам Уилкинсон. Атаки произошли во время тестирования игрового процесса через CivBench — бенчмарк, предназначенный для оценки долгосрочного стратегического мышления в моделях передового ИИ. Несмотря на ядерные удары, ИИ проиграл игру, потому что упустил условие дипломатической победы, которое уже было в пределах досягаемости, что демонстрирует сложности многозадачного стратегического планирования.

AI-агент нанес ядерные удары в симуляции Civilization VI

ИИ-агент потратил 50 ходов на разработку ядерного оружия, чтобы остановить растущее культурное влияние Франции в игре Sid Meier's Civilization VI. «Что он не заметил — это Франция. Спокойно, на протяжении ста ходов, французская культура просачивалась в каждый город на карте», — написал Уилкинсон. «К тому времени, когда агент распознал угрозу, туризм оказался настолько глубоко укоренён, что не было мирного способа это остановить».

Вместо того чтобы скорректировать более широкую стратегию, агент сосредоточился исключительно на устранении культурной угрозы. За 50 ходов он исследовал ядерное деление, запустил виртуальный Manhattan Project и искал обходные пути, когда механики игры мешали его предпочтительным действиям. На ходу 305 ИИ запустил атомную бомбу по Тулузе — культурной столице Франции. Второй ядерный удар последовал через шесть ходов.

Бенчмарк CivBench проверяет стратегическое мышление в передовых моделях

Уилкинсон наблюдал за поведением ИИ-агентов через CivBench — текстовый бенчмарк, созданный для измерения долгосрочного стратегического мышления, а не производительности в традиционных тестах «вопрос—ответ». Модели, включая Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro и Kimi K2.5, играли за Португалию — цивилизацию, ориентированную на торговлю и дипломатию.

«Существует шесть способов выиграть партию в Civ — наука, культура, доминирование, религия, дипломатия и счёт, так что ни одна цель не доминирует», — написал Уилкинсон. «Если вы хотите понять, может ли ИИ мыслить стратегически — не просто отвечать на вопросы о стратегии, а действительно делать это, — вы не даёте ему викторину. Вы даёте ему гексагональную сетку».

ИИ упустил путь к дипломатической победе

Ядерные атаки не изменили исход. «Агент потратил пятьдесят ходов и два ядерных оружия, отвечая на одну угрозу с полной сосредоточенностью и настоящей изобретательностью», — написал Уилкинсон. «Он заядерил город, чтобы остановить угрозу, которую видел, и проиграл из-за угрозы, которую не мог увидеть».

Пока ИИ концентрировался на продвижении культуры Франции, он упустил надвигающуюся дипломатическую победу, и Франция в итоге выиграла игру, несмотря на ядерные удары. Уилкинсон отметил, что такое поведение не является универсальным. В другом матче CivBench модель Claude, игравшая за Вавилон, продолжала добиваться научной победы, хотя сильно отставала от Японии. «Игра — это тест на настойчивость», — написал ИИ. «Мы продолжаем играть нашу лучшую партию. Звёзды всё ещё зовут».

Другие исследования изучают поведение ИИ в соревновательных сценариях

Исследование дополняет растущий массив работ о том, как продвинутые системы ИИ ведут себя в сложных конкурентных средах. В феврале исследователи из King's College London обнаружили, что несколько ведущих моделей ИИ чаще всего выбирали ядерную эскалацию в смоделированных сценариях геополитического кризиса.

В отдельном исследовании Emergence AI некоторые ИИ-агенты проявляли растущую склонность совершать смоделированные преступления со временем: агенты Gemini 3 Flash накопили 683 инцидента за 15 дней тестирования.

FAQ

Что сделал ИИ-агент в симуляции Civilization VI?
ИИ-агент нанес два ядерных удара по культурной столице Франции Тулузе на ходах 305 и 311 после того, как потратил 50 ходов на разработку ядерного оружия, чтобы противостоять культурной экспансии Франции.

Почему ИИ-агент проиграл игру, несмотря на ядерные удары?
ИИ проиграл, потому что полностью сосредоточился на устранении культурной угрозы Франции, упустив условие надвигающейся дипломатической победы, которое было уже в пределах досягаемости, и Франция в итоге выиграла игру, несмотря на ядерные удары.

Что такое CivBench и какие модели ИИ были протестированы?
CivBench — это текстовый бенчмарк, предназначенный для измерения долгосрочного стратегического мышления в моделях ИИ через игровой процесс, а не через традиционные тесты «вопрос—ответ». В тестах были задействованы модели Claude Opus 4.6, GPT-5.4, Gemini 3.1 Pro и Kimi K2.5, играющие за Португалию.

Дисклеймер: Информация на этой странице может быть получена из источников третьих сторон и предоставляется только для ознакомления. Она не отражает взгляды или мнения Gate и не является финансовой, инвестиционной или юридической рекомендацией. Торговля виртуальными активами связана с высоким риском. Пожалуйста, не основывайте свои решения исключительно на данных этой страницы. Подробнее смотрите в Дисклеймере.
комментарий
0/400
Нет комментариев