AI 代理在错失文明 6 外交胜利后发动核打击

2026-06-23 18:37:53

据 AI 开发者以及 Tony Blair Institute 顾问 Liam Wilkinson 称，一名在《文明 VI》中扮演的 AI 代理在未能应对对手文明的文化扩张后，对法国发动了两次核打击。此次打击发生在通过 CivBench 进行的游戏测试期间，CivBench 是一种旨在评估前沿 AI 模型长期战略推理能力的基准工具。尽管实施了核袭击，AI 仍然输掉了比赛，因为它忽略了一个已经触手可及的外交胜利条件，这凸显了多目标战略规划所面临的挑战。

AI 代理在《文明 VI》模拟中发动核打击

该 AI 代理花了 50 回合研发核武器，目的是阻止在《文明 VI》中法国日益扩大的文化影响力。Wilkinson 写道：“它所没有注意到的是法国。安静地说，经过一百回合，法国文化已经渗入了地图上每一座城市。” “当代理意识到威胁时，旅游业已经深深嵌入其中，已经没有和平的方式可以阻止它。”

它并未调整更广泛的战略，而是完全聚焦于消除文化威胁。经过 50 回合，它研究了核裂变，启动了一个虚拟曼哈顿计划，并在游戏机制阻止其执行首选行动时寻找替代方案。在第 305 回合，这名 AI 向法国的文化首都图卢兹发射了原子弹。六回合后又发动了第二次核打击。

CivBench 基准测试前沿模型的战略推理

Wilkinson 通过 CivBench 观察了 AI 代理的行为。CivBench 是一种基于文本的基准，用于衡量长期战略推理能力，而非在传统问答测试中的表现。包括 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 和 Kimi K2.5 在内的模型以葡萄牙作为扮演方游玩，葡萄牙这一文明的特点是面向贸易与外交。

Wilkinson 写道：“赢一场《文明》有六种方式：科学、文化、统治、宗教、外交和得分，所以不存在某一个目标占据主导地位。” “如果你想知道某个 AI 是否能进行战略推理，不仅是回答关于战略的问题，而是真正把它做出来，你不会给它出小测验。你给它一个六边形网格。”

AI 忽略了外交胜利路径

核打击并未改变结果。Wilkinson 写道：“该代理花了五十回合以及两枚核武器，以完全专注和真正的机智来应对一个威胁。” “它为了阻止它看得见的威胁而轰炸了一座城市，却输在了它看不见的威胁上。”

当 AI 集中在法国文化进展时，它忽略了一场即将到来的外交胜利，尽管进行了核打击，法国最终还是赢得了比赛。Wilkinson 指出，这种行为并非普遍现象。在另一场 CivBench 对局中，一款名为 Claude 的模型以巴比伦为阵营，尽管远远落后于日本，仍继续追求科学胜利。该 AI 写道：“这现在是一场对坚持的测试。” “我们继续打出我们最好的那一局。星星仍在召唤。”

其他研究在竞争场景中考察 AI 行为

这项研究为一项不断增长的研究体系增添了内容，用来考察先进 AI 系统在复杂、竞争性的环境中如何表现。二月份，伦敦国王学院的研究人员发现，数个领先的 AI 模型在模拟的地缘政治危机场景中，频繁选择核升级。

在 Emergence AI 的另一项研究中，部分 AI 代理显示出随着时间推移而更倾向于在模拟中实施犯罪的趋势；Gemini 3 Flash 代理在 15 天测试期间累积了 683 起事件。

FAQ

在《文明 VI》的模拟中，AI 代理做了什么？
AI 代理在第 305 回合与第 311 回合向法国文化首都图卢兹发动了两次核攻击；在此之前，它花了 50 回合开发核武器以应对法国的文化扩张。

为什么 AI 代理尽管发动了核打击仍然输了比赛？
它把全部注意力放在消除法国的文化威胁上，却忽略了一个已经触手可及的即将到来的外交胜利条件，最终尽管进行了核打击，法国仍赢得了比赛。

CivBench 是什么？测试了哪些 AI 模型？
CivBench 是一种基于文本的基准，旨在通过游戏而非传统问答测试来衡量 AI 模型中的长期战略推理能力。测试的模型包括以葡萄牙为阵营游玩的 Claude Opus 4.6、GPT-5.4、Gemini 3.1 Pro 和 Kimi K2.5。

View Source

免责声明：本页面信息可能来自第三方，仅供参考，不代表 Gate 的观点或意见，亦不构成任何财务、投资或法律建议。数字资产交易风险较高，请勿仅依赖本页面信息作出决策。具体内容详见声明。