Дослідники виявили, що AI-агенти вразливі до атак prompt injection, із 79% рівнем успіху

Дослідники з Nanyang Technological University, ST Engineering, IBM Research та Університету Іллінойсу в Урбана-Шампейн з’ясували, що AI-агенти, підживлені GPT-5 і Gemini, не можуть стабільно протистояти атакам із підміною підказок (prompt injection). Про це йдеться в дослідженні, опублікованому в четвер.

У 3 168 симуляціях атак прямі атаки з підміною підказок досягали успіху понад 79% випадків, тоді як непрямі атаки, вбудовані в вебконтент, показували рівень успішності в діапазоні від 41,67% до 68,16%. Дослідники створили StakeBench — бенчмарк для перевірки відповідей AI-агентів на такі атаки в реалістичних онлайн-середовищах — і зазначили, що підміна підказок залишається критичною вразливістю, оскільки AI-агенти стають масовими для вебперегляду, досліджень, покупок і торгівлі криптовалютою.

Застереження: інформація на цій сторінці може походити зі сторонніх джерел і надається виключно для ознайомлення. Вона не відображає позицію чи думку Gate і не є фінансовою, інвестиційною чи юридичною консультацією. Торгівля віртуальними активами пов’язана з високим ризиком. Будь ласка, не покладайтеся лише на інформацію з цієї сторінки під час прийняття рішень. Детальніше дивіться у Застереженні.
Прокоментувати
0/400
Немає коментарів