彭博社報導,一個私人論壇群組疑似在 Anthropic 旗下資安模型 Mythos 公開宣布當天即突破管制,透過第三方承包商的存取權限,成功進入系統使用該模型,引發外界對頂尖 AI 模型安全治理的擔憂。
(Anthropic 推出全球資安計畫 Glasswing,新模型 Mythos 為何不開放大眾使用?)
Mythos 上線首日就遭未授權存取
Anthropic 在 4 月 7 日宣布全新網路安全 AI 模型 Claude Mythos,然而一個身份至今未公開的私人線上論壇群組,據報已悄然取得該模型的存取權限。
據悉,這群人並非透過傳統駭客手法入侵,而是利用對 Anthropic 過去模型 URL 格式的掌握,合理推測出 Mythos 在系統中的線上位置。關鍵破口在於一名任職於 Anthropic 第三方承包商的員工。他原本就持有查看 Anthropic AI 模型的合法授權,群組成員則透過這個合規入口滲透進入系統。
事後,該群組向彭博提供了截圖與即時操作示範作為證明,並透露他們持續使用 Mythos 至今,但強調他們的目的僅止於「把玩新模型」,無意從事任何破壞行為,因為他們不想被發現。
Mythos 是什麼?為何引發外界擔憂?
Claude Mythos 是 Anthropic 專為企業網路安全防禦所打造的 AI 模型,被團隊定義為「能力太強以致於不適合公開發布」的工具。其核心能力在於主動識別數位系統中的安全漏洞,協助企業在遭受攻擊前即完成修補。
然而,這把「防禦之劍」也可以是「雙面刃」。Anthropic 坦言,一旦 Mythos 落入惡意人士之手,其能力也足以被用於發動攻擊。因此公司透過名為「Project Glasswing」的資安計畫,僅將 Mythos 開放給少數經過嚴格審核的大型機構或科技公司使用。
這套封閉管控機制的核心假設是:受信任的合作夥伴能夠確保彼此的存取權限不會外洩。
(Anthropic Mythos 引監管擔憂,貝森特、鮑威爾召銀行高層開緊急會議)
Anthropic 回應:正在調查,未受影響
Anthropic 對此表示:「我們正在調查一份聲稱透過第三方供應商環境,未經授權存取 Claude Mythos Preview 的報告。」公司強調,目前尚未發現自身系統受到影響,且此事件初步判斷「較有可能是存取權限遭到濫用,而非外部駭客攻擊」。
即便目前搶先使用 Mythos 的用戶並沒有做出惡意行為,然而事件本身仍讓資安專家高度警戒。資安公司 Smarttech247 執行長 Raluca Saceanu 指出:
強大 AI 工具一旦在既定管控機制之外被存取或使用,風險不僅僅是一件資安事件,更可能引發詐欺、網路濫用或其他惡意用途的疑慮。
這件事會造成什麼影響?AI 安全管制的弱點
這次事件真正讓人擔憂的地方,並非是有人試圖破壞,而是在於它所揭示的系統性脆弱:當 AI 公司將高敏感性模型的存取權下放至第三方供應商時,整條管制網路中任何一個環節的疏漏,都可能成為破口並引發危機。
如今,Mythos 事件提醒了整個產業,在 AI 能力快速進步的當下,安全架構的設計不能僅靠信任,更需要能夠承受信任失效的制度韌性。對於 Anthropic 而言,如何重建外界對其合作夥伴管控機制的信心,將是比調查本身更長遠的課題。
這篇文章 Anthropic 武器級資安模型 Mythos 遭未授權存取:他們是如何做到的? 最早出現於 鏈新聞 ABMedia。
免責聲明:本頁面資訊可能來自第三方,不代表 Gate 的觀點或意見。頁面顯示的內容僅供參考,不構成任何財務、投資或法律建議。Gate 對資訊的準確性、完整性不作保證,對因使用本資訊而產生的任何損失不承擔責任。虛擬資產投資屬高風險行為,價格波動劇烈,您可能損失全部投資本金。請充分了解相關風險,並根據自身財務狀況和風險承受能力謹慎決策。具體內容詳見
聲明。
相關文章
Google Jules 重新品牌為端到端代理式產品開發平台,為新版本開放候補名單
Gate News 訊息,4 月 23 日——Google 的 Jules 團隊宣布為產品新版本開放候補名單,將 Jules 從非同步程式碼代理重新定位為端到端的代理式產品開發平台。根據官方描述,升級後的平台可讀取完整產品情境,判斷接下來應該建立什
GateNews20分鐘前
Perplexity 揭露 Web 搜尋代理後訓練方法;基於 Qwen3.5 的模型在準確率與成本上超越 GPT-5.4
Perplexity 使用搭配 Qwen3.5 模型的 SFT,並在其後使用帶有 RL 的強化學習;透過多跳 QA 資料集與規則量表檢查來提升搜尋的準確性與效率,實現業界一流的 FRAMES 表現。
摘要:Perplexity 的線上搜尋代理後訓練流程,結合監督式微調 (SFT),以透過線上強化學習 (RL)(使用 GRPO 演算法)來強制遵循指令與語言一致性。RL 階段使用專有的多跳可驗證問答資料集,以及基於規則量表的對話資料,以防止 SFT 漂移,並採用獎勵閘控與同組內效率懲罰。評估顯示 Qwen3.5-397B-SFT-RL 在 FRAMES 上取得頂尖表現:單次工具呼叫準確率為 57.3%,四次呼叫為 73.9%,每次查詢成本為 $0.02;在這些指標上超越 GPT-5.4 與 Claude Sonnet 4.6。定價採用 API 計費,且不包含快取。
GateNews53分鐘前
TikTok 移除超過 538,000 支未授權的 AI 生成影片;多個平台啟動治理計畫
Gate 新聞訊息,4 月 23 日 — TikTok 宣布對侵犯用戶權益的 AI 生成內容展開全面打擊,並披露截至目前已移除超過 538,000 支影片,且已對超過 4,000 個帳戶進行處罰。該平台將把執法重點放在 AI 深偽、聲音
GateNews1小時前
經濟學家傅鵬稱:傳統金融將加速進入加密市場
Gate News 消息,4 月 23 日——新火集團首席經濟學家傅鵬(Fu Peng)在 2026 年香港機構數位財富管理高峰會上,分享了傳統金融與加密資產趨同的展望。據傅鵬所言,傳統金融機構與加密市場的整合
GateNews1小時前
OpenAI Codex 團隊修復 OpenClaw 驗證錯誤,顯著改善代理行為
OpenClaw 從 Pi 切換到 Codex harness,以修復靜默驗證回退,並透過兩個 PR 分別解決橋接與回退問題;修復之後,代理程式從淺層心跳輪詢轉向完整的工作迴圈,讓進度得以推進。
摘要:OpenClaw 的 Codex harness 優化處理了一個關鍵的驗證漏洞:當使用 Codex 搭配 OpenAI 模型時,系統會靜默回退到 Pi harness。兩個拉取請求修復驗證橋接並防止靜默回退,進而變更執行階段的介面適配器。結果是,代理程式的行為從淺層心跳輪詢演進為完整的工作迴圈:讀取上下文、分析任務、編輯程式庫並驗證進度,提升跨心跳的連貫性與可見度。
GateNews1小時前
慢霧 CISO 示警:ShinyHunters 聲稱入侵 Anthropic 內部系統
根據慢霧(SlowMist)首席資訊安全長 23pds 於 4 月 23 日在 X 平台發布的警示,駭客組織 ShinyHunters 聲稱已入侵與 Anthropic Mythos 模型相關的內部系統,並公開分享用戶管理面板、AI 實驗儀表板及模型性能與成本分析等截圖佐證,但 Anthropic 官方尚未發表聲明。
Market Whisper2小時前