Anthropic 週四宣布,它預期在完成額外的安全防護測試後,將於「未來幾週」擴大其 Claude Mythos AI 模型的存取。該公司是在其全新 Opus 4.8 模型發佈的同時作出上述說明,這也是它迄今最明確的跡象,顯示這套聚焦資安的系統將有更廣泛的可用性。自 3 月以來,Anthropic 已透過 Project Glasswing 限制 Mythos 的存取,此舉是在研究人員與政府機關就該模型具備自主網路攻擊能力發出警告之後才採取。此公告正值整個 AI 產業就具備進攻性資安能力的先進系統應如何釋出給客戶的更廣泛辯論之際。
目前的存取限制
Anthropic 透過 Project Glasswing 限制 Claude Mythos 的散佈,該計畫為特定科技公司、安全研究人員以及政府合作夥伴提供在受控條件下的存取。該公司最初是在 3 月洩漏的部落格材料中描述 Mythos,稱其為「我們迄今開發過最強大的 AI 模型」,並將其定位為高於其 Opus 模型的等級。Anthropic 表示,該模型「預示即將迎來一波能以遠超防禦者投入程度的方式,利用漏洞的模型」。該公司未說明在更廣泛推出之前仍有哪一些安全防護尚未完成,亦未說明是否所有客戶將獲得相同的存取水準。對於實作細節的評論請求,Anthropic 未回應。
已記錄的技術能力
英國的 AI Security Institute 發現,Mythos 在測試期間可自主完成一場 32 步驟的模擬企業網路攻擊。4 月,Mozilla 報告指出,Mythos 在內部安全評估中辨識出 Firefox 的 271 個漏洞。本月較早時,資安新創 Calif 表示,一個預覽版本有助於研究人員開發針對蘋果 M5 Mac 晶片的攻擊鏈。Anthropic 曾主張,Mythos 能協助防禦者在攻擊者加以利用前,辨識並修補軟體漏洞。安全研究人員與政府機關則警告,這些相同能力可能會加速網路攻擊。
產業針對釋出策略的辯論
該模型已成為 AI 產業內部關於先進系統釋出的核心討論主題。5 月在「Core Memory」播客接受訪談時,OpenAI 執行長 Sam Altman 指控 Anthropic 以「恐懼為本的行銷」來推動,並表示,對資安風險的警告可用來合理化限制對強大 AI 系統的存取。由 Decrypt 之母公司 Dastan 所營運的預測市場平台 Myriad 上,使用者截至週四給出 Mythos 在 6 月底前釋出的 44% 機率,高於當日上午的 17.5%。
已確認的下一步
Anthropic 表示,它「在開發這些安全防護方面正快速取得進展」,並預期「未來幾週將把 Mythos 等級的模型帶到所有客戶」。
常見問題集
Project Glasswing 是什麼?
Project Glasswing 是 Anthropic 的受限存取計畫,提供特定科技公司、安全研究人員以及政府合作夥伴在特定條件下,受控存取 Claude Mythos 模型。
Mythos 在測試中已辨識出哪些漏洞?
Mozilla 報告指出,Mythos 在 4 月的內部安全評估中辨識出 Firefox 的 271 個漏洞。英國的 AI Security Institute 文件記錄顯示,該模型能自主完成一場 32 步驟的模擬企業網路攻擊。資安新創 Calif 表示,預覽版本有助於開發針對蘋果 M5 Mac 晶片的攻擊鏈。
Anthropic 何時首次宣布 Mythos?
Claude Mythos 最初是在 3 月於草稿版 Anthropic 部落格材料在網路上外洩後浮出水面。該公司將其描述為「我們迄今開發過最強大的 AI 模型」,並將其定位為高於其 Opus 模型的全新等級。