Laut Forschern der Nanyang Technological University, ST Engineering, IBM Research und der University of Illinois Urbana-Champaign können von GPT-5 und Gemini angetriebene KI-Agenten Prompt-Injection-Angriffe nicht durchgängig zuverlässig abwehren, wie eine am Donnerstag veröffentlichte Studie ergab.
In 3.168 Angriffssimulationen waren direkte Prompt-Injection-Angriffe in mehr als 79% der Fälle erfolgreich, während indirekte Angriffe, die in Webinhalte eingebettet waren, Erfolgsquoten zwischen 41,67% und 68,16% erreichten. Die Forscher entwickelten StakeBench, einen Benchmark, um die Antworten von KI-Agenten auf solche Angriffe in realistischen Online-Umgebungen zu testen, und stellten fest, dass Prompt Injection weiterhin eine kritische Schwachstelle bleibt, da KI-Agenten für Web-Browsing, Recherche, Shopping und den Krypto-Handel immer stärker zum Standard werden.