根據南洋理工大學(Nanyang Technological University)、新加坡科技工程有限公司(ST Engineering)、IBM Research,以及伊利諾伊大學厄巴納-香檳分校(University of Illinois Urbana-Champaign)的研究人員指出,驅動 GPT-5 與 Gemini 的 AI 代理無法持續抵禦提示注入攻擊,週四發表的一項研究發現了這一點。
在 3,168 次攻擊模擬中,直接提示注入攻擊的成功率超過 79%,而嵌入網路內容中的間接攻擊,成功率介於 41.67% 到 68.16%。研究人員開發了 StakeBench,這是一個基準,用以在真實的線上環境中測試 AI 代理對此類攻擊的回應,並指出,隨著 AI 代理成為網路瀏覽、研究、購物與加密貨幣交易的主流工具,提示注入仍然是一項關鍵弱點。