OpenZeppelin 審査 EVMbench がデータ汚染を発見

OpenZeppelin審計EVMbench發現資料污染

ブロックチェーンセキュリティ監査会社のOpenZeppelinは、OpenAIとParadigmの共同開発したスマートコントラクトセキュリティAI基準テストであるEVMbenchを独立監査し、二つの重大な問題を発見しました:訓練データの汚染と、少なくとも4つの「高危険度脆弱性」と分類されたものが実際には無効な偽造であることです。

EVMbenchのデータ汚染問題:AI訓練の期限に関わる重要な脆弱性

EVMbenchは2026年2月中旬にリリースされ、異なるAIモデルのスマートコントラクトの脆弱性識別・修復・活用能力を評価することを目的としています。テスト期間中、AIエージェントのネットアクセス権は遮断され、インターネットからの検索を防止していました。しかし、OpenZeppelinの監査は構造的な脆弱性を明らかにしました:この基準は、2024年から2025年中頃までに行われた120回の監査から抽出された脆弱性に基づいており、多くのトップAIモデルの知識訓練の終了日も同じく2025年中頃に設定されているのです。

これは、AIエージェントが事前訓練期間中にEVMbenchの脆弱性レポートに触れている可能性が高く、その記憶にすべての問題の解答が保存されていることを意味します。OpenZeppelinは次のように述べています:「AIの安全性において最も重要な能力は、モデルがこれまで見たことのないコードの新たな脆弱性を発見することです。」データセットの規模が限定的なため、汚染が全体の評価に与える影響はさらに大きくなっています。

EVMbench監査で判明した主要な問題点

  • 訓練データの汚染:AIの事前訓練にEVMbenchの脆弱性レポートが含まれている可能性があり、「ゼロ知識発見」テストの意義を失わせている
  • 無効な高危険度脆弱性の分類:少なくとも4つの高危険度とされた脆弱性は実際には利用できない
  • 評価システムの欠陥:EVMbenchはこれら偽の脆弱性をAIが発見した場合にポイントを付与していたが、その評価基準に問題がある
  • データセットの規模の制約:これにより汚染の影響が評価結果に過度に反映されている
  • 現状のランキング:AnthropicのClaude 4.6がトップ、OpenAIのOC-GPT-5.2とGoogleのGemini 3 Proが続く

偽脆弱性の危機:少なくとも4つの高危険度分類が無効であることが判明

データ汚染に加え、OpenZeppelinはより具体的な誤りも発見しました。彼らは少なくとも4つの高危険度とされた脆弱性について評価し、これらは実際には存在しないことを確認しました。さらに重要なのは、それらの脆弱性の攻撃方法の記述自体が全く効果的でないという点です。

「これらは主観的な重大性の違いではなく、記載された攻撃方法が実行できないことに起因します」とOpenZeppelinは指摘しています。もしAIエージェントがこれらの偽の脆弱性を「発見」した場合、評価システムは誤った結果を報酬していることになります。

OpenZeppelinは、今回の監査はAIのブロックチェーンセキュリティにおける潜在能力を否定するものではないと強調しています。「問題は、AIがスマートコントラクトの安全性を変えるかどうかではなく、それらのツールを構築・評価するために用いるデータと基準が、実際に保護すべきコントラクトと同じ基準を満たしているかどうかにあります。」

原文表示
免責事項:このページの情報は第三者から提供される場合があり、Gateの見解または意見を代表するものではありません。このページに表示される内容は参考情報のみであり、いかなる金融、投資、または法律上の助言を構成するものではありません。Gateは情報の正確性または完全性を保証せず、当該情報の利用に起因するいかなる損失についても責任を負いません。仮想資産への投資は高いリスクを伴い、大きな価格変動の影響を受けます。投資元本の全額を失う可能性があります。関連するリスクを十分に理解したうえで、ご自身の財務状況およびリスク許容度に基づき慎重に判断してください。詳細は免責事項をご参照ください。

関連記事

Aave 回應五千萬鎂 Swap 事故:用戶誤接受 99.9% 價格衝擊,Aave 將推出 Shield 防護機制

去中心化借貸協議 Aave 最近發布事故報告,說明 3 月 12 日一名用戶在其平台上進行大額 Swap 交易時,由於市場流動性不足,最終只獲得約 3.6 萬美元的 AAVE。Aave 強調該事件非因協議漏洞,而是用戶接受了極端不利報價,並計劃推出新的安全機制 Aave Shield 以降低未來誤操作的風險。

ChainNewsAbmedia3時間前

某地址因签署钓鱼签名损失超72万美元valBUSD与valTUSD

Gate News消息,3月15日,据Scam Sniffer监测,一地址因签署钓鱼邮件中的increase Allowance签名,损失了720,108美元的valBUSD和valTUSD。

GateNews3時間前

Cảnh báo: Lừa đảo “đầu độc địa chỉ” gia tăng mạnh trên Ethereum sau nâng cấp Fusaka

A concerning trend is emerging on Ethereum as automated scam campaigns exploit user habits rather than technical flaws. Following the 2025 Fusaka upgrade, "address poisoning" attacks surged, with small "dust" transactions flooding victims' transaction histories. Users are urged to verify wallet addresses carefully to mitigate fraud risk.

TapChiBitcoin5時間前

Mỹ và châu Âu triệt phá mạng proxy độc hại Socksescort

U.S. and European officials dismantled the Socksescort proxy network using AVRecon malware, seizing over 369,000 compromised devices. The operation led to the recovery of millions in lost funds, highlighting ongoing vulnerabilities in home routers and the need for improved cybersecurity measures.

TapChiBitcoin6時間前

Tether 冻结 Tron 链上某地址约 1200 万枚 USDT

3月14日,Tether冻结了一个Tron链地址持有的11,960,680枚USDT,使用智能合约的黑名单功能。这类冻结通常因洗钱、诈骗等原因触发,自2023年以来,Tether已累计冻结超42亿美元的USDT。

GateNews16時間前
コメント
0/400
コメントなし