Ataque de AudioHijack secuestra modelos de voz de IA con una tasa de éxito de hasta el 96%, según un estudio

De acuerdo con una investigación de la Universidad de Zhejiang presentada en el 47º Simposio IEEE sobre Seguridad y Privacidad en San Francisco, los investigadores desarrollaron AudioHijack, que oculta comandos imperceptibles en audio para manipular grandes modelos de lenguaje de audio con una tasa de éxito del 79-96%.

El ataque modifica las formas de onda de audio digital de maneras que son imperceptibles para los humanos, pero alteran la forma en que la IA interpreta la señal, lo que le permite anular el comportamiento del modelo incluso cuando hay instrucciones legítimas del usuario presentes. Los investigadores probaron AudioHijack en 13 modelos de voz de código abierto y en sistemas comerciales de Microsoft y Mistral, y encontraron que puede forzar a los modelos a rechazar solicitudes, difundir información falsa, insertar enlaces maliciosos o ejecutar acciones no autorizadas como búsquedas web y descargas de archivos.

Aviso legal: La información en esta página puede provenir de fuentes de terceros y es solo para referencia. No representa las opiniones ni puntos de vista de Gate y no constituye asesoramiento financiero, de inversión ni legal. El comercio de activos virtuales implica un alto riesgo. No te bases únicamente en la información presentada en esta página para tomar decisiones. Para más detalles, consulta el Aviso legal.
Comentar
0/400
Sin comentarios