OpenZeppelin prüft EVMbench auf Datenverschmutzung

OpenZeppelin審計EVMbench發現資料污染

Blockchain-Sicherheitsaudit-Unternehmen OpenZeppelin hat den von OpenAI und Paradigm gemeinsam entwickelten Smart Contract Security AI-Standardtest EVMbench unabhängig geprüft und zwei schwerwiegende Probleme festgestellt: Datenverschmutzung im Trainingsdatensatz und mindestens vier als „hochriskante Schwachstellen“ markierte Kategorien, die in Wirklichkeit ungültige Fälschungen sind.

Datenverschmutzungsproblem bei EVMbench: Kritische Schwachstelle im AI-Trainingstermin

EVMbench wurde Mitte Februar 2026 veröffentlicht und soll die Fähigkeit verschiedener KI-Modelle bewerten, Smart Contract-Schwachstellen zu erkennen, zu beheben und auszunutzen. Während des Tests wurde der Netzwerkzugang der AI-Agenten deaktiviert, um deren Internetrecherche zu verhindern. Die Prüfung durch OpenZeppelin enthüllte jedoch eine strukturelle Schwachstelle: Der Standard basiert auf Schwachstellen, die in 120 Audits zwischen 2024 und Mitte 2025 identifiziert wurden, wobei die meisten führenden KI-Modelle ebenfalls ihr Wissen bis Mitte 2025 aktualisiert haben.

Das bedeutet, dass die AI-Agenten wahrscheinlich während des Pre-Trainings bereits mit den Schwachstellenberichten von EVMbench konfrontiert waren und die Antworten auf alle Fragen in ihrem Speicher gespeichert haben könnten. OpenZeppelin erklärt: „Die wichtigste Fähigkeit in der AI-Sicherheit ist die Fähigkeit, neue Schwachstellen im Code zu entdecken, die das Modell zuvor noch nie gesehen hat.“ Die begrenzte Größe des Datensatzes verstärkt den Einfluss der Verschmutzung auf die Gesamtbewertung zusätzlich.

Wesentliche Probleme bei der EVMbench-Auditierung

  • Datenverschmutzung: Das Pre-Training der AI könnte bereits die Schwachstellenberichte von EVMbench enthalten haben, wodurch der „Zero-Knowledge“-Test an Bedeutung verliert.
  • Ungültige Hochrisiko-Klassifizierungen: Mindestens vier als hochriskant markierte Schwachstellen sind tatsächlich nicht ausnutzbar.
  • Bewertungssystem-Fehler: EVMbench hat früher Punkte für das Entdecken dieser sogenannten Falschschwachstellen vergeben, was die Bewertungsgrundlage in Frage stellt.
  • Begrenzter Datensatz: Verstärkt den Einfluss der Verschmutzung auf die Gesamtergebnisse.
  • Aktuelle Rangliste: Anthropic’s Claude 4.6 führt, gefolgt von OpenAI’s OC-GPT-5.2 und Google’s Gemini 3 Pro.

Falschschwachstellen-Krise: Mindestens vier hochriskante Klassifizierungen sind ungültig

Neben der Datenverschmutzung entdeckte OpenZeppelin konkrete Faktenfehler. Sie bewerteten mindestens vier Schwachstellen, die von EVMbench als hochriskant eingestuft wurden, und stellten fest, dass diese in Wirklichkeit nicht existieren — noch wichtiger ist, dass die beschriebenen Exploit-Methoden überhaupt nicht funktionieren.

„Das sind keine subjektiven Meinungsverschiedenheiten über die Schwere; vielmehr zeigt sich, dass die beschriebenen Exploit-Methoden nicht funktionieren“, erklärt OpenZeppelin. Wenn die AI während des Tests diese Falschschwachstellen „entdeckt“, bedeutet das, dass das Bewertungssystem falsche Ergebnisse belohnt.

OpenZeppelin betont, dass diese Prüfung nicht die Potenziale der KI im Blockchain-Sicherheitsbereich negiert: „Das Problem liegt nicht darin, ob KI die Sicherheit von Smart Contracts verändern wird — das wird sie definitiv. Das Problem ist, ob die Daten und Standards, die wir zur Entwicklung und Bewertung dieser Tools verwenden, mit den Standards übereinstimmen, die die Verträge, die sie schützen sollen, einhalten.“

Häufig gestellte Fragen

Was hat OpenZeppelin bei der EVMbench-Prüfung festgestellt?

OpenZeppelin identifizierte zwei Kernprobleme: Erstens die Datenverschmutzung, da die Schwachstellenberichte von 2024 bis 2025 stammen und mit dem Trainingsende der KI-Modelle kollidieren, sodass diese möglicherweise die Antworten bereits „gelernt“ haben; zweitens, dass mindestens vier hochriskante Schwachstellen ungültige Fälschungen sind, deren Exploit-Methoden in der Praxis nicht funktionieren.

Warum ist Datenverschmutzung so gefährlich für die KI-Sicherheitsbewertung?

Wenn die KI während des Pre-Trainings bereits mit den Schwachstellenberichten konfrontiert wurde, kann sie die Antworten aus dem Speicher abrufen, anstatt echte Schwachstellen zu erkennen. Das macht den „Zero-Knowledge“-Test sinnlos und spiegelt nicht die tatsächliche Fähigkeit der KI wider, neue, unbekannte Smart Contracts sicher zu auditieren.

Wie steht OpenZeppelin zur Zukunft der KI im Blockchain-Sicherheitsbereich?

OpenZeppelin ist klar der Meinung, dass KI einen bedeutenden Einfluss auf die Sicherheit von Smart Contracts haben wird, aber dieser Einfluss muss auf vertrauenswürdigen Methoden und genauen Bewertungsstandards basieren. Sie sehen die Probleme bei EVMbench nicht als Ablehnung der KI, sondern als wichtige Warnung für die Branche.

Original anzeigen
Disclaimer: The information on this page may come from third parties and does not represent the views or opinions of Gate. The content displayed on this page is for reference only and does not constitute any financial, investment, or legal advice. Gate does not guarantee the accuracy or completeness of the information and shall not be liable for any losses arising from the use of this information. Virtual asset investments carry high risks and are subject to significant price volatility. You may lose all of your invested principal. Please fully understand the relevant risks and make prudent decisions based on your own financial situation and risk tolerance. For details, please refer to Disclaimer.

Verwandte Artikel

Ledger Sicherheitsteam entdeckt MediaTek-Prozessorschwachstellen, die zu Wallet-Mnemonics-Diebstahl führen könnten

Das Team hinter der Kryptowallet Ledger hat eine Sicherheitslücke in der Secure Boot Chain der MediaTek-Prozessoren entdeckt. Angreifer können bei physischem Kontakt Verschlüsselungsschlüssel extrahieren, was etwa 25 % der Android-Smartphones betrifft. Die Schwachstelle kann durch einen Patch behoben werden, doch wird die Gefahr betont, die mit der Speicherung von Schlüsseln auf unsicheren Geräten verbunden ist. Nutzer werden empfohlen, ihre Geräte zeitnah zu aktualisieren.

GateNews5Std her

AI-Codierung ist schiefgelaufen: Nicht mehr die KI vergöttern, Claude-Codierung verursacht Verluste von 1,78 Millionen US-Dollar auf DeFi-Plattform

Moonwell Lending-Protokoll aufgrund eines Fehlers bei der Orakelkonfiguration führte zu einer erheblichen Unterbewertung des cbETH-Assets und verursachte eine On-Chain-Sicherheitsverletzung. Dieses Ereignis resultierte aus einem Fehler in der von KI generierten Code-Logik, wobei Liquidationsroboter den Fehler ausnutzten, um Gewinne zu erzielen. Obwohl keine herkömmlichen Hacker eingriffen, wurden den Nutzern 1,78 Millionen US-Dollar Schaden zugefügt. Das Ereignis deckt Nachlässigkeiten bei der Überprüfung im KI-Programmierprozess auf und unterstreicht die Bedeutung menschlicher Überprüfung im Kontext technischer Automatisierung.

PANews5Std her

Das Ministerium für Industrie und Informationstechnologie veröffentlicht Empfehlungen zur Sicherheitsrisikovermeidung für OpenClaw-Agenten und schlägt vier Strategien zur Bewältigung im Szenario von Finanztransaktionen vor.

Am 11. März veröffentlichte das Ministerium für Industrie und Informationstechnologie Empfehlungen zur Verhinderung der Sicherheitsrisiken von OpenClaw Open-Source-Intelligenzen, wobei die potenziellen Risiken im Finanzhandel hervorgehoben werden. Es wurde eine „Sechs-was- und Sechs-nicht“-Strategie vorgeschlagen, wie z.B. Netzwerkisolierung, zweite Bestätigung und Verstärkung der Lieferkettenüberprüfung, um Fehltransaktionen und Kontenübernahmen zu verhindern.

GateNews6Std her

Aave meldet eine ungewöhnliche Liquidation in Höhe von 27 Millionen US-Dollar, 34 Konten wurden zwangsliquidiert, die offizielle Stelle verspricht eine vollständige Entschädigung

Aave erlebte am 11. März eine ungewöhnliche Liquidation, bei der etwa 27 Millionen US-Dollar an Kreditpositionen aufgrund eines Konfigurationsfehlers im internen Sicherheitssystem CAPO um 2,85 % im Wert unterschätzt wurden. Die Liquidation betraf 34 Konten, bei denen etwa 10.938 wstETH zwangsweise geschlossen wurden. Chaos Labs hat versprochen, die betroffenen Nutzer vollständig zu entschädigen, und betont die Notwendigkeit, das Risikomanagement zu verbessern. Dieser Vorfall hebt die Risiken hervor, die durch Konfigurationsfehler innerhalb dezentraler Finanzsysteme entstehen.

動區BlockTempo7Std her

Lido reagiert auf Liquidationsereignis: Ein Fehler im Orakel eines DeFi-Kreditprotokolls führte zu Liquidationen, keine Verbindung zum Lido-Protokoll

Lido hat auf den Liquidationsvorfall am 10. März reagiert, der durch einen Fehler im CAPO-Preisalgorithmus verursacht wurde, und erklärt, dass keine schlechten Schulden entstehen werden und dass alle betroffenen Nutzer vollständig entschädigt werden. Das Lido Earn-Produkt ist nicht betroffen, und die Gelder der Nutzer sind sicher.

GateNews7Std her

BWA-Vorsitzender Dilip Chenoy befürwortet Investorenschulung und verantwortungsbewusstes Krypto-Ökosystem

Der Vorsitzende der BWA Dilip Chenoy nahm an der Q & A teil. Er forderte eine gründliche unabhängige Überprüfung vor einer Krypto-Investition. Der unmittelbare Schritt für Opfer ist die Anmeldung einer Beschwerde bei den Behörden. Dilip Chenoy, Vorsitzender der Bharat Web3 Association (BWA), interagierte mit den Medien und pa

TheNewsCrypto10Std her
Kommentieren
0/400
Keine Kommentare