✍️ Gate 廣場「創作者認證激勵計劃」進行中!
我們歡迎優質創作者積極創作,申請認證
贏取豪華代幣獎池、Gate 精美周邊、流量曝光等超過 $10,000+ 豐厚獎勵!
立即報名 👉 https://www.gate.com/questionnaire/7159
📕 認證申請步驟:
1️⃣ App 首頁底部進入【廣場】 → 點擊右上角頭像進入個人主頁
2️⃣ 點擊頭像右下角【申請認證】進入認證頁面,等待審核
讓優質內容被更多人看到,一起共建創作者社區!
活動詳情:https://www.gate.com/announcements/article/47889
Anthropic神話級模型Claude Mythos 不向公眾開放
Anthropic今天宣布了一個計划:Project Glasswing(玻璃翼計划),之所以推出這個計划是因為Anthropic训练出了一個全新的超强模型Claude Mythos Preview,這其實就是前兩天cc源码泄露中提到的模型。
项目参與方包括亚馬逊AWS、苹果、博通、思科、CrowdStrike、谷歌、摩根大通、Linux基金會、微軟、英伟達、Palo Alto Networks,以及Anthropic自己,共12家機构联合發起。
說人话就是由于這個模型太强了要采取安全测试模式,只给認可的機构内部使用,不對外開放,有多强呢,大家直接看数据,代码和推理能力吊打opus 4.6:
代码:
推理:
搜索與計算機使用
opus字面意思是杰作,Mythos字面意思是神话,Anthropic CEO以及合作方一众大佬都出來為這個計划站台了。
Anthropic明确表示,不打算将Claude Mythos Preview向公众開放。但長期目标是讓用户能够安全使用同等能力级别的模型。為此,他们計划先在即将推出的Claude Opus模型上開發和驗證相關安全防护機制,在風險可控的条件下完成迭代,再逐步推進,可能很快會推出一個opus 新版本提供相應的能力。
我们來详细看看Project Glasswing究竟是什么東西
這個模型發現了什么?
過去几周,Anthropic用Claude Mythos Preview扫描了世界上主流的操作系統、浏览器和其他重要軟件。
结果:發現了数千個此前從未被發現的零日漏洞,其中大量被评定為高危级别。
几個具体案例:
OpenBSD中一個存在了27年的漏洞。OpenBSD以安全性著称,被用于運行防火墙等關键基础設施。這個漏洞允许攻击者仅通過連接目标機器,就能讓其遠程崩溃。
FFmpeg中一個存在了16年的漏洞。FFmpeg被無数軟件用于视頻编解码。模型找到漏洞的那行代码,此前已被自動化测试工具扫描了500萬次,從未被發現。
Linux内核中,模型自主發現并串联了多個漏洞,使攻击者能從普通用户权限提升至完全控制整台機器。
以上漏洞均已向相關軟件维护方報告,目前已全部修复。其余漏洞,Anthropic已先行發布加密哈希值,待修复完成後再公開具体细节。
為什么要做這件事?
Anthropic给出的判断是:AI模型在發現和利用軟件漏洞方面的能力,已經超過了除少数頂级人类专家之外的所有人。
這种能力的扩散,是時間問题,而不是是否會發生的問题。
全球网络犯罪造成的經济损失每年估計約為5000億美元。针對医疗系統、能源基础設施、政府機构的攻击已經造成實質伤害,也已對民用和军事基础設施构成持續威胁。
AI讓發動這类攻击所需的成本、門槛和专業程度都大幅下降。
Anthropic的邏輯是:與其等别人先把這种能力用于進攻,不如主動把它用于防御。
計划具体怎么做?
Project Glasswing目前包含兩個层面。
第一层面是12家创始合作伙伴,他们将获得Claude Mythos Preview的访問权限,用于扫描和修复自身核心系統的漏洞,重點方向包括本地漏洞检测、二進制黑盒测试、端點安全、渗透测试等。
第二层面是另外40余家构建或维护關键軟件基础設施的组織,同样将获得模型访問权限,用于扫描自有及開源系統。
Anthropic為此承诺提供最高1億美元的模型使用额度。研究預览期结束後,Claude Mythos Preview将向参與方提供商業访問,定價為每百萬輸入/輸出token 25/125美元,支持通過Claude API、Amazon Bedrock、Google Cloud Vertex AI和Microsoft Foundry接入。
此外,Anthropic通過Linux基金會向Alpha-Omega和OpenSSF捐赠250萬美元,向Apache軟件基金會捐赠150萬美元,合計捐赠400萬美元,用于支持開源軟件维护方應對這一新形势。開源軟件维护方可通過Claude for Open Source项目申請访問权限。
接下來的計划
在信息共享方面,合作伙伴将尽可能互通信息和最佳實践。Anthropic承诺在90天内公開發布研究進展報告,内容包括發現的漏洞数量、已修复的問题,以及可披露的改進成果。
在政策建議方面,Anthropic将與主要安全機构合作,就以下方向形成實践建議:漏洞披露流程、軟件更新流程、開源與供應鏈安全、安全軟件開發生命周期、受监管行業标准、漏洞分类的规模化與自動化、补丁自動化。
完整信息見官方原文:https://www.anthropic.com/glasswing