研究人员发现:AI 代理易受提示注入攻击,79% 的成功率

据南洋理工大学、ST Engineering、IBM Research以及伊利诺伊大学厄巴纳-香槟分校的研究人员称,周四发表的一项研究发现,由 GPT-5 和 Gemini 驱动的 AI 代理无法始终如一地抵御提示注入攻击。

在 3,168 次攻击模拟中,直接提示注入攻击的成功率超过 79%,而嵌入在网页内容中的间接攻击的成功率介于 41.67% 和 68.16% 之间。研究人员开发了 StakeBench,这是一项基准,用于在逼真的在线环境中测试 AI 代理对这类攻击的响应,并指出随着 AI 代理在网页浏览、研究、购物以及加密货币交易中变得主流,提示注入仍然是一个关键漏洞。

免责声明:本页面信息可能来自第三方,仅供参考,不代表 Gate 的观点或意见,亦不构成任何财务、投资或法律建议。数字资产交易风险较高,请勿仅依赖本页面信息作出决策。具体内容详见声明
评论
0/400
暂无评论