OpenZeppelin аудит EVMbench виявив забруднення даних

MarketWhisper

2026-03-03 06:12:00

Аудиторська компанія з безпеки блокчейну OpenZeppelin провела незалежний аудит EVMbench — бенчмарку безпеки ШІ смарт-контрактів, запущеного OpenAI у співпраці з Paradigm, і виявила дві серйозні проблеми: забруднення даних у тренуванні та щонайменше 4 класифікації, позначені як «високоризикові вразливості», насправді були недійсними підробками.

Проблема забруднення даних EVMbench: критична вразливість у дедлайнах навчання ШІ

EVMbench, випущений у середині лютого 2026 року, має на меті оцінити здатність різних моделей ШІ виявляти, усувати та використовувати вразливості смарт-контрактів, перекриваючи доступ агентів ШІ до інтернету під час тестування та не даючи їм шукати відповіді в інтернеті. Однак аудит OpenZeppelin виявив структурну вразливість: бенчмарк базувався на вразливостях, відфільтрованих у 120 аудитах, проведених між 2024 і серединою 2025 року, а дедлайн навчання знань для більшості топових моделей ШІ також призначений на середину 2025 року.

Це означає, що агент ШІ, ймовірно, був підданий впливу звіту про вразливості EVMbench під час попереднього навчання, і він може мати відповіді на всі питання, збережені в пам’яті. OpenZeppelin зазначив: «Найважливіша можливість безпеки ШІ — це знаходження нових вразливостей у коді, яких модель раніше не бачила.» Обмежений розмір набору даних ще більше посилює вплив забруднення на загальну оцінку.

Ключові питання, визначені аудитом EVMbench

Забруднення тренувальних даних: Попереднє навчання агентів ШІ могло включати звіти про вразливості від EVMbench, що зробило тестування «виявлення з нульовим розгадуванням» безглуздим

Недійсна класифікація вразливостей високого ризику: Щонайменше 4 вразливості, позначені як високоризиковані, не можуть бути фактично використані

Недоліки системи підрахунку очок: EVMbench раніше зазначав поведінку ШІ при виявленні цих псевдовразливостей, і виникла проблема з базою оцінювання

Обсяг даних обмежений: додатково посилює вплив забруднення на загальні результати оцінки

Поточна таблиця лідерів: Лідирує Claude 4.6 від Anthropic, за ним йдуть OC-GPT-5.2 від OpenAI та Gemini 3 Pro від Google

Псевдокриза вразливості: щонайменше 4 класифікації високого ризику були доведені як недійсні

Окрім забруднення даних, OpenZeppelin також виявив більш конкретні фактичні помилки. Вони оцінили щонайменше 4 вразливості, класифіковані EVMbench як високоризикові вразливості, і виявили, що їх насправді не існує — і, що важливіше, описані експлойти просто не працювали.

"Це не суб’єктивні відмінності за серйозністю; Натомість виявилося, що описаний експлойт не спрацював», — зазначив OpenZeppelin. Якщо агент ШІ «знаходить» ці псевдо-вразливості під час тестування, це означає, що система оцінювання винагороджує неправильні результати.

OpenZeppelin наголосив, що цей аудит не є запереченням потенціалу ШІ в безпеці блокчейну: «Питання не в тому, чи змінить ШІ безпеку смарт-контрактів — це безумовно. Питання в тому, чи відповідають дані та бенчмарки, які ми використовуємо для створення та оцінки цих інструментів, тим самим стандартам, що й контракти, для яких вони призначені захищати.»

Поширені запитання

Які проблеми виявив аудит EVMbench від OpenZeppelin?

OpenZeppelin виявив дві основні проблеми: по-перше, забруднення даних навчання, вразливості тестування EVMbench з аудиторських звітів з середини 2024 до 2025 року, що перекриваються з дедлайнами навчання моделей ШІ, ці моделі могли «бачити» відповідь під час попереднього навчання; По-друге, щонайменше 4 класифікації вразливостей високого ризику є недійсною підробкою, а описані методи атак фактично нездійсненні.

Чому забруднення даних таке небезпечне для оцінки безпеки ШІ?

Якщо модель ШІ була піддана бенчмаркованим звітам про вразливості під час попереднього навчання, вона може «відповідати» на питання в пам’яті, а не у справжніх можливостях виявлення вразливостей. Через це вся оцінка втрачає значення «тестування з нульовим розгадуванням» і не може дійсно відобразити реальні можливості аудиту безпеки ШІ при роботі з новими та невідомими смарт-контрактами.

Яка позиція OpenZeppelin щодо майбутнього ШІ в безпеці блокчейну?

OpenZeppelin чітко зазначив, що ШІ матиме значний вплив на безпеку смарт-контрактів, але наголосив, що цей вплив має базуватися на достовірних методологіях і точних оцінках. Вони вважають, що проблема EVMbench — це не сигнал заперечення ШІ, а важливе попередження для галузевих стандартів.

Переглянути оригінал

Застереження: Інформація на цій сторінці може походити від третіх осіб і не відображає погляди або думки Gate. Вміст, що відображається на цій сторінці, є лише довідковим і не є фінансовою, інвестиційною або юридичною порадою. Gate не гарантує точність або повноту інформації і не несе відповідальності за будь-які збитки, що виникли в результаті використання цієї інформації. Інвестиції у віртуальні активи пов'язані з високим ризиком і піддаються значній ціновій волатильності. Ви можете втратити весь вкладений капітал. Будь ласка, повністю усвідомлюйте відповідні ризики та приймайте обережні рішення, виходячи з вашого фінансового становища та толерантності до ризику. Для отримання детальної інформації, будь ласка, зверніться до Застереження.

Пов'язані статті

Ізраїльський журналіст отримав погрози смертю від користувачів деякої платформи прогнозування за точне повідомлення про ракетний удар Ірану

Ринок прогнозування Примусові заходи Інциденти безпеки

Журналіст Times of Israel піддався переслідуванням і смертельним загрозам за точне повідомлення про ракетний удар Ірану. Погрозувач намагався змусити його змінити звіт через неудачу ставки. Журналіст подав заяву до правоохоронців, заявивши, що дотримуватиметься професійної етики, і висловив занепокоєння, що інші люди можуть піддатися спокусі.

GateNews21хв. тому

Сполучені Штати, Великобританія та Канада спільно розпочали операцію Operation Atlantic для боротьби з криптовалютним фішингом, що використовує схвалення.

Примусові заходи Інциденти безпеки

Агенції правоохорони США, Великої Британії та Канади спільно запустили "Operation Atlantic" для боротьби з "схваленням фішингом" - фішингом, спрямованим на користувачів криптовалюти. Передбачається, що в 2025 році крипто-шахрайства генеруватимуть близько 17 мільярдів доларів незаконних доходів. Ця операція спрямована на ідентифікацію жертв, попередження потенційних жертв та відстеження вкрадених активів.

GateNews34хв. тому

GAIB фронтенд зазнав атаки безпеки, рекомендується користувачам призупинити взаємодію

Інциденти безпеки

Gate News повідомляє, що 16 березня проект інфраструктури AI GAIB опублікував повідомлення про те, що його фронтенд-сторінка наразі стикається з проблемою безпеки, і закликає користувачів утриматися від будь-яких взаємодій із сайтом до подальшого повідомлення. GAIB підкреслює, що кошти користувачів і смарт-контракти залишаються в безпеці та не зазнали впливу. Команда повідомила, що активно працює над вирішенням цієї проблеми і надасть додаткові оновлення після повного відновлення роботи сайту.

GateNews56хв. тому

Venus Protocol досліджує шкідливу діяльність у $THE Pool середовища спекуляцій щодо flash-кредитів

Інциденти безпеки Ончейн-дані

Venus Protocol розслідує підозрілу активність, що вказує на потенціальну атаку Flash Loan на пули $THE та $CAKE . Це призвело до призупинення позик та виведення $THE, оскільки платформа оцінює ризик та занепокоєння спільноти щодо можливої маніпуляції ринком.

BlockChainReporter4год тому

Південнокорейський суд відхилив заяву Фонду Flow про зупинення делістингу FLOW на трьох біржах

Щоденні криптоновини Примусові заходи Інциденти безпеки Біржовий ризик

Сеульський центральний окружний суд Південної Кореї відхилив клопотання про заборону Flow Foundation та Dapper Labs щодо трьох бірж, підтримавши припинення торгівлі FLOW. Суд дійшов висновку про недостатність доказів та необхідність захисту інвесторів. FLOW все ще торгується на Korbit, але був виключений з трьох інших бірж.

GateNews6год тому

Steam 8 ігор з вбудованим шкідливим програмним забезпеченням, FBI визначив потерпілих у період 2024–2026 років

bitcoin news Примусові заходи Інциденти безпеки

Американське ФБР розпочало розслідування 8 ПК-ігор на платформі Steam, які підозрюються в наявності шкідливого ПО, спрямованого переважно на користувачів, які завантажили ці ігри у період 2024-2026 років. Потерпілі можуть подати інформацію до ФБР для отримання компенсації. Ця подія показує, що масивна користувацька база Steam робить її мішенню для зловмисних атак, а криптовалютні активи стають основною метою таких атак.

MarketWhisper6год тому

Прокоментувати

0/400

Немає коментарів