据 Beating,Nicholas Carlini——Anthropic 顶级安全专家——在测试该公司的新 Mythos 模型后,其立场发生了显著转变。Carlini 过去以批评 AI 安全延迟而闻名,但他发现 Mythos 仅用几天时间就识别出 479 个 Linux 内核漏洞——这些漏洞他自己从未发现过——并能自动生成攻击代码。出于对风险的担忧,他起初发出了一份警告备忘录,敦促公司推迟发布。
这些漏洞发现引发了安全界的广泛恐慌,被称为“Bugmageddon”。截至 2026 年 4 月,已有超过 700 个网站遭攻击者利用新发现的漏洞入侵。此前,在亚马逊首席执行官 Andy Jassy 向白宫警告了竞争模型中的越狱漏洞之后,政府对 Anthropic 发布了紧急禁令。然而,Carlini 随后被派驻华盛顿,担任公司的游说人员,如今他正向政府官员主张:发布一个经过加固的版本比将模型锁在内部更安全。