美国政府周五发布了一项紧急出口管制指令,要求 Anthropic 立即暂停其两款最先进的 AI 模型 Claude Fable 5 和 Claude Mythos 5 的访问权限,范围覆盖所有外国公民,理由是对潜在越狱漏洞的国家安全担忧。该指令禁止在美国境内或境外访问,迫使 Anthropic 为其整个客户群禁用这些模型。政府认为其已找到一种绕过公开可用的 Fable 5 模型的方法,尽管 Anthropic 质疑该问题的严重性,称该漏洞很简单,并且可以使用其他公开可用的模型(如 GPT-5.5)加以复现。该命令发布之际,Anthropic 与政府之间围绕 AI 安全与监管及监控协议的持续紧张局势仍在升温。
政府指令暂停 Fable 5 和 Mythos 5 访问
该指令禁止任何外国公民访问这些模型,无论是在美国境内还是境外。该命令的覆盖范围之广,迫使 Anthropic 为确保遵守要求而禁用其整个客户群的这些模型。该函件未提供其国家安全关切的具体细节,但政府认为其已获悉一种绕过(或“越狱”)公开可用的 Fable 5 模型的方法。Mythos 5 的护栏更少,而且在发现网络安全漏洞方面尤其强大,且仅提供给特定合作伙伴。这两款模型刚在数天前发布。
Anthropic 质疑越狱严重性
Anthropic 对该发现的严重程度提出异议。公司表示,其已审阅了该技术的演示,并得出结论:已识别的漏洞看起来相对简单,而且其他公开可用的模型也能够发现这些漏洞,无需任何绕过。公司表示,截至目前,政府仅提供了关于潜在“狭窄、非通用”越狱的口头证据——本质上是要求模型读取一个特定代码库并修复任何软件缺陷。Anthropic 还补充称,其已验证所展示的能力水平已在竞争模型中广泛可得,包括 OpenAI 的 GPT-5.5。
在遵从该指令的同时,Anthropic 表示其认为此举将树立危险先例。公司在信中写道:“如果这一标准被应用到整个行业,我们认为这将实质性地阻止所有前沿模型提供商进行所有新的模型部署。”所有其他 Anthropic 模型的访问将不受影响。公司表示正在尽快恢复访问。
David Sacks 在社交媒体上批评 Anthropic
周六,David Sacks——美国总统科学与技术顾问委员会(President's Council of Advisers on Science and Technology)的联合主席——在 X 上写道:“一位高度可信、得到信任的合作伙伴(同时与 Anthropic 以及美国政府(U.S. government)合作),在测试 Fable 时发现了对这些护栏的越狱。行政部门要求 [Anthropic 首席执行官 Dario Amodei] 修复该越狱或撤下该模型。Dario 拒绝了。”
Sacks 进一步声称,Anthropic 对政府请求的反应背离了公司自身关于 AI 安全与监管必要性的公开说法——Amodei 本周在一篇博客文章中再次分享了这一观点。Sacks 写道:“Anthropic 优先继续提供面向消费者的模型,而非安全。对此,行政部门下达了出口管制。行政部门是出于不情愿才这么做的。令人惊讶的是,Anthropic 并不想配合一项合理的安全请求(即修复越狱问题)。Anthropic 的反应与其作为安全 AI 研究社区的品牌与理念高度不一致。”
Sacks 还补充称,行政部门希望 Anthropic 能修复该问题,并让 Fable 5 恢复向公众发布。“行政部门重视 Anthropic 的技术能力,并认为,尽管这个问题很严重,但应当能够轻松解决,”他写道。“球在 Anthropic 那边。”
年初围绕监控协议的早先争议
今年早些时候,Anthropic 与美国政府(U.S. government)发生分歧:当这家 AI 公司拒绝签署一项扩大的协议时,该协议将允许对美国人进行大规模国内监控,以及完全自主的致命武器系统。美国总统 Donald Trump(President Donald Trump)在会谈破裂后猛烈抨击该公司,美国国防部(Department of Defense)还将 Anthropic 标记为“供应链风险”——该公司已在法庭上对这一认定提出挑战。此后,有报道称,随着政府希望使用 Claude Mythos 及其他模型,双方之间的对峙有所降温。此前的分歧(Earlier Dispute Over Surveillance Agreement)也因此有所缓和。
常见问题
美国政府周五要求 Anthropic 做什么?
美国政府周五发布了一项紧急出口管制指令,要求 Anthropic 立即暂停其两款最先进的 AI 模型 Claude Fable 5 和 Claude Mythos 5 的访问权限,范围覆盖所有外国公民,理由是对潜在越狱漏洞的国家安全担忧。
为什么 Anthropic 会质疑政府的指令?
Anthropic 对该发现的严重程度提出异议,称所识别的漏洞看起来相对简单,且包括 OpenAI 的 GPT-5.5 在内的其他公开可用模型也能够发现这些漏洞,同样无需任何绕过。公司表示,政府仅就潜在的“狭窄、非通用”越狱提供了口头证据。
David Sacks 对 Anthropic 对该指令的回应说了什么?
周六,David Sacks 在 X 上写道:当行政部门提出要求时,Anthropic 首席执行官 Dario Amodei 拒绝修复该越狱或撤下该模型。Sacks 称,Anthropic 的反应背离了公司在 AI 安全与监管方面的公开说法,他写道:“Anthropic 优先继续提供面向消费者的模型,而非安全。”