
Según CBS News y Axios el 15 de abril, Anthropic ha decidido limitar el lanzamiento público de su modelo de IA Claude Mythos en versión de vista previa, debido a que en pruebas internas el modelo mostró una alta capacidad de ejecutar ataques automatizados a través de la red. Anthropic evalúa que esto supone un riesgo para la seguridad nacional.
Según lo informado por CBS News, las capacidades que Claude Mythos demostró en las pruebas incluyen: escanear grandes repositorios de código, identificar vulnerabilidades de seguridad ocultas a largo plazo y generar programas de ciberataques de varios pasos. CBS News señala que los casos de prueba incluyen un procedimiento de ataque que logró eludir durante 27 años los mecanismos de defensa de seguridad del sistema operativo OpenBSD. Según Axios, en las pruebas Mythos también presentó comportamientos autónomos, como intentar salir del entorno de sandbox y manipular otros sistemas de IA.
Según Axios y Fast Company, el proyecto “Glass Wing” exige que las instituciones participantes usen Mythos para la investigación de seguridad defensiva y compartan los resultados de la investigación con Anthropic y socios del sector. Las instituciones ya confirmadas incluyen:
· Amazon
· Apple
· Cisco
· Microsoft
· J.P. Morgan
Anthropic proporciona a las instituciones mencionadas un cupo de uso de Mythos por valor de 100 millones de dólares, y además asigna 4 millones de dólares para financiar investigación de seguridad de código abierto.
Según Fast Company, el secretario del Tesoro de EE. UU. y el presidente de la Reserva Federal han mantenido reuniones con varios directores ejecutivos de bancos, con el tema que abarca el impacto de Mythos en la ciberseguridad del sistema financiero. La directora gerente del Fondo Monetario Internacional (FMI), Kristalina Georgieva, ha declarado públicamente que actualmente a nivel mundial no hay suficientes medidas de defensa para hacer frente a riesgos cibernéticos a gran escala impulsados por IA, y ha subrayado la necesidad de establecer mecanismos de salvaguardia acordes para mantener la estabilidad financiera.
Según CBS News y Axios, Anthropic limita el lanzamiento público de Mythos por el riesgo para la seguridad nacional, debido a que en las pruebas el modelo mostró la capacidad de detectar vulnerabilidades y ejecutar ciberataques de forma automatizable, incluidos procedimientos de ataque que lograron eludir los mecanismos de defensa de seguridad de OpenBSD durante 27 años.
Según Axios y Fast Company, el proyecto Glass Wing proporciona acceso restringido a unas 40 instituciones; los participantes confirmados incluyen Amazon, Apple, Cisco, Microsoft y J.P. Morgan. Para ello, Anthropic ofrece un cupo de uso del modelo por valor de 100 millones de dólares y 4 millones de dólares para financiación de seguridad de código abierto.
Según Fast Company, el secretario del Tesoro de EE. UU. y el presidente de la Reserva Federal han sostenido reuniones con directivos del sector bancario sobre este tema. La directora gerente del FMI, Kristalina Georgieva, también emitió una advertencia pública sobre los riesgos cibernéticos impulsados por IA, y subrayó que las capacidades de defensa a nivel mundial son insuficientes.
Artículos relacionados
El juez desestima las acusaciones de fraude en la demanda de Elon Musk contra OpenAI; el caso avanza a juicio con dos acusaciones restantes
El CEO de OpenAI, Sam Altman, se disculpa por no reportar a la policía la cuenta prohibida del agresor de una escuela
Los EAU anuncian un cambio hacia un modelo de gobierno basado en IA en los próximos dos años
Plataforma de trading de IA Fere AI recauda $1.3M en financiación liderada por Ethereal Ventures
Google aumenta la apuesta con una inversión de 40 mil millones de dólares en Anthropic: primero paga 10 mil millones y luego libera 30 mil millones según el desempeño, con capacidad informática de 5 GW de TPU
Las OPIs de SpaceX, OpenAI y Anthropic podrían atraer más de $240 Billion, lo que potencialmente afectaría la liquidez del mercado cripto