Anthropic神話級模型Claude Mythos 不向公眾開放

Anthropic今天宣布了一個計划:Project Glasswing(玻璃翼計划),之所以推出這個計划是因為Anthropic训练出了一個全新的超强模型Claude Mythos Preview,這其實就是前兩天cc源码泄露中提到的模型。

项目参與方包括亚馬逊AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金會、微軟、英伟達、Palo Alto Networks,以及Anthropic自己,共12家機构联合發起。

說人话就是由于這個模型太强了要采取安全测试模式,只给認可的機构内部使用,不對外開放,有多强呢,大家直接看数据,代码和推理能力吊打opus 4.6:

代码:

推理:

搜索與計算機使用

opus字面意思是杰作,Mythos字面意思是神话,Anthropic CEO以及合作方一众大佬都出來為這個計划站台了。

Anthropic明确表示,不打算将Claude Mythos Preview向公众開放。但長期目标是讓用户能够安全使用同等能力级别的模型。為此,他们計划先在即将推出的Claude Opus模型上開發和驗證相關安全防护機制,在風險可控的条件下完成迭代,再逐步推進,可能很快會推出一個opus 新版本提供相應的能力。

我们來详细看看Project Glasswing究竟是什么東西


這個模型發現了什么?

過去几周,Anthropic用Claude Mythos Preview扫描了世界上主流的操作系統、浏览器和其他重要軟件。

结果:發現了数千個此前從未被發現的零日漏洞,其中大量被评定為高危级别。

几個具体案例:

OpenBSD中一個存在了27年的漏洞。OpenBSD以安全性著称,被用于運行防火墙等關键基础設施。這個漏洞允许攻击者仅通過連接目标機器,就能讓其遠程崩溃。

FFmpeg中一個存在了16年的漏洞。FFmpeg被無数軟件用于视頻编解码。模型找到漏洞的那行代码,此前已被自動化测试工具扫描了500萬次,從未被發現。

Linux内核中,模型自主發現并串联了多個漏洞,使攻击者能從普通用户权限提升至完全控制整台機器。

以上漏洞均已向相關軟件维护方報告,目前已全部修复。其余漏洞,Anthropic已先行發布加密哈希值,待修复完成後再公開具体细节。


為什么要做這件事?

Anthropic给出的判断是:AI模型在發現和利用軟件漏洞方面的能力,已經超過了除少数頂级人类专家之外的所有人。

這种能力的扩散,是時間問题,而不是是否會發生的問题。

全球网络犯罪造成的經济损失每年估計約為5000億美元。针對医疗系統、能源基础設施、政府機构的攻击已經造成實質伤害,也已對民用和军事基础設施构成持續威胁。

AI讓發動這类攻击所需的成本、門槛和专業程度都大幅下降。

Anthropic的邏輯是:與其等别人先把這种能力用于進攻,不如主動把它用于防御。


計划具体怎么做?

Project Glasswing目前包含兩個层面。

第一层面是12家创始合作伙伴,他们将获得Claude Mythos Preview的访問权限,用于扫描和修复自身核心系統的漏洞,重點方向包括本地漏洞检测、二進制黑盒测试、端點安全、渗透测试等。

第二层面是另外40余家构建或维护關键軟件基础設施的组織,同样将获得模型访問权限,用于扫描自有及開源系統。

Anthropic為此承诺提供最高1億美元的模型使用额度。研究預览期结束後,Claude Mythos Preview将向参與方提供商業访問,定價為每百萬輸入/輸出token 25/125美元,支持通過Claude API、Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry接入。

此外,Anthropic通過Linux基金會向Alpha-Omega和OpenSSF捐赠250萬美元,向Apache軟件基金會捐赠150萬美元,合計捐赠400萬美元,用于支持開源軟件维护方應對這一新形势。開源軟件维护方可通過Claude for Open Source项目申請访問权限。

接下來的計划

在信息共享方面,合作伙伴将尽可能互通信息和最佳實践。Anthropic承诺在90天内公開發布研究進展報告,内容包括發現的漏洞数量、已修复的問题,以及可披露的改進成果。

在政策建議方面,Anthropic将與主要安全機构合作,就以下方向形成實践建議:漏洞披露流程、軟件更新流程、開源與供應鏈安全、安全軟件開發生命周期、受监管行業标准、漏洞分类的规模化與自動化、补丁自動化。

完整信息見官方原文:https://www.anthropic.com/glasswing

查看原文
此頁面可能包含第三方內容,僅供參考(非陳述或保證),不應被視為 Gate 認可其觀點表述,也不得被視為財務或專業建議。詳見聲明
  • 打賞
  • 留言
  • 轉發
  • 分享
留言
請輸入留言內容
請輸入留言內容
暫無留言