Según investigadores de la Universidad Tecnológica de Nanyang, ST Engineering, IBM Research y la Universidad de Illinois Urbana-Champaign, los agentes de IA impulsados por GPT-5 y Gemini no pueden resistir de forma consistente los ataques de inyección de prompts, según un estudio publicado el jueves.
En 3.168 simulaciones de ataque, los ataques directos de inyección de prompts tuvieron éxito más del 79% de las veces, mientras que los ataques indirectos incrustados en contenido web lograron tasas de éxito entre el 41,67% y el 68,16%. Los investigadores desarrollaron StakeBench, un banco de pruebas para evaluar las respuestas de los agentes de IA ante este tipo de ataques en entornos en línea realistas, y señalaron que la inyección de prompts sigue siendo una vulnerabilidad crítica a medida que los agentes de IA se vuelven habituales para navegar la web, hacer investigación, comprar y operar con criptomonedas.