Anthropic Waffensicherheits-Modelle Mythos wurden ohne Genehmigung zugegriffen: Wie haben sie das geschafft?

ChainNewsAbmedia

Bloomberg berichtet, dass eine private Foren-Gruppe angeblich am selben Tag, an dem die von Anthropic entwickelten Sicherheitsmodelle Mythos unter Aufsicht gestellt wurden, öffentlich angekündigt hat, die Kontrollen durchbrochen zu haben. Durch Zugriffsrechte, die über einen Drittanbieter-Auftragnehmer vermittelt wurden, gelang es der Gruppe, in das System einzudringen und das Modell zu nutzen, was weltweit Befürchtungen hinsichtlich der Sicherheits-Governance führender KI-Modelle auslöst.

(Anthropic startet mit Glasswing ein globales Cybersicherheits-Programm. Warum wird das neue Modell Mythos nicht für die breite Öffentlichkeit freigegeben?)

Am ersten Tag des Starts kam es zu nicht autorisiertem Zugriff

Anthropic kündigte am 7. April ein neues KI-Netzwerksicherheitsmodell namens Claude Mythos an. Eine private Online-Forengruppe, deren Identität bis heute nicht offengelegt wurde, habe laut Berichten jedoch stillschweigend Zugriff auf dieses Modell erhalten.

Dem Vernehmen nach sei diese Gruppe nicht mit herkömmlichen Hacker-Methoden eingedrungen, sondern habe die Kenntnis über frühere Modell-URL-Formate von Anthropic genutzt, um den Online-Standort von Mythos im System plausibel zu erraten. Die entscheidende Schwachstelle lag bei einem Mitarbeiter, der als Angestellter eines Drittanbieter-Auftragnehmers bei Anthropic tätig ist. Er habe bereits über eine legitime Autorisierung zum Ansehen von Anthropic-KI-Modellen verfügt; die Mitglieder der Gruppe seien dann über diesen regelkonformen Zugang in das System eingedrungen.

Später stellte die Gruppe Bloomberg Screenshots sowie eine Live-Demo der durchgeführten Aktionen als Nachweis zur Verfügung und gab zu, dass sie Mythos bis heute weiterhin nutzen. Dabei betonten sie, dass ihr Zweck nur darin bestehe, „mit dem neuen Modell herumzuspielen“, und dass sie keinerlei destruktive Handlungen beabsichtigten, weil sie nicht entdeckt werden wollen.

Was ist Mythos? Warum sorgt das für Besorgnis?

Claude Mythos ist ein von Anthropic entwickeltes KI-Modell für den unternehmensweiten Schutz in der Cybersicherheit. Das Team definiert es als ein Werkzeug, das „zu mächtig ist, um für die Öffentlichkeit freigegeben zu werden“. Seine Kernfähigkeit besteht darin, Sicherheitslücken in digitalen Systemen proaktiv zu identifizieren und Unternehmen zu ermöglichen, noch bevor ein Angriff erfolgt, bereits eine Reparatur vorzunehmen.

Doch diese „Waffe der Verteidigung“ kann auch eine „zweischneidige Klinge“ sein. Anthropic gibt zu bedenken: Gelangt Mythos in die Hände von böswilligen Akteuren, könnten seine Fähigkeiten ebenfalls für Angriffe eingesetzt werden. Daher öffnet das Unternehmen Mythos im Rahmen eines Cybersicherheitsprogramms namens „Project Glasswing“ nur für wenige, streng geprüfte große Institutionen oder Technologieunternehmen.

Die Kernannahme dieses geschlossenen Kontrollmechanismus lautet: Vertraute Partner können sicherstellen, dass die Zugriffsgenehmigungen untereinander nicht nach außen durchsickern.

(Anthropic äußert Bedenken, dass Mythos die Aufsicht gefährdet. Die Führungskräfte von Bessemt und Powell rufen eine Notfall-Sitzung im Banking ein)

Antwort von Anthropic: Wir untersuchen, keine Beeinträchtigung

Dazu erklärte Anthropic: „Wir untersuchen einen Bericht, der behauptet, dass in einer Umgebung von Drittanbietern auf nicht autorisierte Weise auf Claude Mythos Preview zugegriffen wurde.“ Das Unternehmen betonte, dass derzeit noch nicht festgestellt worden sei, dass die eigenen Systeme betroffen seien, und dass dieser Vorfall vorläufig eher darauf zurückzuführen sei, dass „Zugriffsrechte missbraucht wurden, nicht aber auf einen externen Hackerangriff“.

Auch wenn die Nutzer, die Mythos bislang vorab verwenden konnten, bisher keine böswilligen Handlungen vorgenommen haben, hält der Vorfall Sicherheitsexperten dennoch in erhöhter Alarmbereitschaft. Der CEO des Sicherheitsunternehmens Smarttech247, Raluca Saceanu, erklärte:

Wenn mächtige KI-Tools außerhalb der festgelegten Kontrollmechanismen abgerufen oder genutzt werden, besteht das Risiko nicht nur in einem Sicherheitsvorfall; vielmehr könnte das auch Zweifel an Betrug, Online-Missbrauch oder anderen böswilligen Verwendungszwecken auslösen.

Welche Auswirkungen hat das? Schwächen in der KI-Sicherheitskontrolle

Die eigentliche Ursache der Besorgnis bei diesem Vorfall liegt nicht darin, dass jemand versucht hat, etwas zu zerstören, sondern darin, was er systemisch offenbart: Wenn KI-Unternehmen den Zugriff auf hochsensible Modelle an Drittanbieter auslagern, kann jede noch so kleine Lücke in irgendeinem Glied des gesamten Kontrollnetzwerks zur Schwachstelle werden und eine Krise auslösen.

Der Mythos-Vorfall erinnert nun die gesamte Branche daran: In einer Zeit, in der KI-Fähigkeiten schnell voranschreiten, dürfen Sicherheitsarchitekturen nicht nur auf Vertrauen aufgebaut sein. Es braucht zudem institutionelle Widerstandsfähigkeit, die ein Versagen von Vertrauen überstehen kann. Für Anthropic wird die Frage, wie man das Vertrauen der Öffentlichkeit in die Kontrollmechanismen gegenüber seinen Kooperationspartnern neu aufbaut, eine noch weit über die Untersuchung hinausgehende Aufgabe sein.

Der Artikel „Das waffenfähige Cybersicherheitsmodell Mythos von Anthropic wurde ohne Autorisierung zugänglich gemacht: Wie haben sie das geschafft?“ erschien zuerst bei Lian News ABMedia.

Disclaimer: The information on this page may come from third-party sources and is for reference only. It does not represent the views or opinions of Gate and does not constitute any financial, investment, or legal advice. Virtual asset trading involves high risk. Please do not rely solely on the information on this page when making decisions. For details, see the Disclaimer.
Kommentieren
0/400
Keine Kommentare