Anthropic ha integrado aproximadamente a seis ingenieros en la Agencia de Seguridad Nacional para desplegar su modelo de IA Mythos en operaciones cibernéticas ofensivas, informó el Financial Times el jueves. Los ingenieros están personalizando el modelo para aplicaciones específicas, potencialmente incluyendo la infiltración de redes en China e Irán, según una fuente citada por el FT. El despliegue ocurrió mientras Anthropic publicaba simultáneamente investigaciones que piden un mecanismo coordinado de pausa global para el desarrollo de IA y presentaba una solicitud de IPO que podría valorar a la empresa por encima de 1 billón de dólares.
Anthropic colocó a unos seis ingenieros dentro de la Agencia de Seguridad Nacional para ayudar a desplegar Mythos, su modelo de IA más capaz, para operaciones cibernéticas ofensivas, según el informe del Financial Times. Los ingenieros son personal desplegado hacia adelante que personaliza el modelo para aplicaciones específicas. Una fuente le dijo al FT que el modelo podría ser útil para infiltrarse en redes de países como China e Irán.
Mythos es el mismo modelo que Anthropic se ha negado a liberar públicamente, citando el riesgo de mal uso. La empresa lo limitó a socios verificados a través de Project Glasswing, una coalición restringida que incluye Microsoft, Apple y Amazon. No se confirma si los ingenieros están involucrados en operaciones activas.
Anthropic está demandando al Pentágono después de que el secretario de Defensa Pete Hegseth designara a la empresa como un riesgo en la cadena de suministro a finales de febrero; una etiqueta históricamente reservada para adversarios extranjeros como Huawei. La designación siguió al colapso de un contrato de 200 millones de dólares. El punto clave: Anthropic se negó a permitir que el Departamento de Defensa use Claude para armas totalmente autónomas o para vigilancia masiva interna. El contrato de la NSA fue exento de esa prohibición.
Un juez de California bloqueó la lista negra como una aparente represalia por la Primera Enmienda. Un tribunal de apelaciones del D.C. negó la petición de Anthropic de detener la designación mientras avanza el litigio. La NSA continuó usando Mythos durante este período, según el reporte del FT. El plazo del Pentágono para retirar a Claude de sus sistemas vence en agosto.
El mismo día en que se dio a conocer la historia sobre la NSA, el instituto de investigación interno de Anthropic publicó “When AI Builds Itself”, examinando hasta qué punto Claude ha llegado automatizando su propio desarrollo. Claude ahora escribe más del 80% del código fusionado en la base de código de producción de Anthropic, frente a cifras de un solo dígito bajo antes de que Claude Code lanzara a principios de 2025. Los ingenieros envían aproximadamente ocho veces más código por día que en 2024.
En abril, a los agentes de Claude se les entregó un problema abierto de seguridad de IA—si un modelo más débil puede supervisar de forma fiable a uno más fuerte—y se les dejó ejecutarlo. Dos investigadores humanos recuperaron el 23% de la brecha de desempeño entre los modelos en aproximadamente una semana. Los agentes recuperaron el 97% durante 800 horas acumuladas de cómputo. Los humanos plantearon la pregunta mientras los agentes diseñaron cada experimento. Los autores del informe—líder del Anthropic Institute Marina Favaro y cofundador Jack Clark—lo describieron como el primer caso publicado de Claude ejerciendo juicio de investigación en lugar de solo ejecutar tareas especificadas por otra persona.
El informe defiende una pausa global verificable—múltiples laboratorios de frontera deteniéndose simultáneamente con verificación independiente de que todos realmente se detuvieron. Anthropic afirmó que se uniría a una pausa de este tipo. Los autores compararon el mecanismo propuesto con los tratados nucleares de la era de la Guerra Fría acordados entre Estados Unidos y Rusia.
Anthropic advirtió que la trayectoria se dirige hacia la mejora recursiva y auto-mejoramiento: sistemas de IA que diseñan, construyen y entrenan de forma autónoma a sus propios sucesores, con los humanos desempeñando un papel cada vez menor en cada etapa. Una vez que la IA elige qué experimentos vale la pena ejecutar—no solo ejecutarlos—los humanos pierden el último rol significativo en el ciclo de desarrollo, según el informe. Las pequeñas desalineaciones visibles en los modelos de hoy podrían acumularse a través de generaciones que se auto-mejoran hasta que nadie pueda corregirlas.
En 2023, más de cien figuras importantes en la comunidad de investigación de IA firmaron una carta abierta pidiendo un esfuerzo global para mitigar el riesgo de extinción que el desarrollo de IA intrínsecamente tiene. Unos meses antes de eso, otra carta abierta exigió que OpenAI pausara los avances de ChatGPT debido a su naturaleza peligrosa. Nadie se detuvo después de la carta abierta de 2023. OpenAI no lo hizo. Anthropic tampoco.
¿Qué desplegó Anthropic en la NSA? Anthropic integró a aproximadamente seis ingenieros en la Agencia de Seguridad Nacional para desplegar su modelo de IA Mythos para operaciones cibernéticas ofensivas, según un informe del Financial Times publicado el jueves. Los ingenieros están personalizando el modelo para aplicaciones específicas, potencialmente incluyendo la infiltración de redes en China e Irán.
¿Por qué Anthropic está demandando al Pentágono? Anthropic está demandando al Pentágono después de que el secretario de Defensa Pete Hegseth designara a la empresa como un riesgo en la cadena de suministro a finales de febrero tras el colapso de un contrato de 200 millones de dólares. Anthropic se negó a permitir que el Departamento de Defensa use Claude para armas totalmente autónomas o para vigilancia masiva interna. Un juez de California bloqueó la lista negra como una aparente represalia por la Primera Enmienda, mientras que un tribunal de apelaciones del D.C. negó la petición de Anthropic de detener la designación durante el litigio.
¿Cuánto código escribe Claude para Anthropic? Claude ahora escribe más del 80% del código fusionado en la base de código de producción de Anthropic, frente a cifras de un solo dígito bajo antes de que Claude Code lanzara a principios de 2025. Los ingenieros envían aproximadamente ocho veces más código por día que en 2024, según el informe “When AI Builds Itself” de Anthropic, publicado por el instituto de investigación interno de la compañía.
Noticias relacionadas
Anthropic presenta un folleto confidencial de oferta pública inicial y prueba el apetito de valoración de la IA
Anthropic pide una desaceleración global de la IA ante el riesgo de la mejora recursiva y la auto-mejora
Las acciones de CrowdStrike caen un 7% pese a la demanda de ciberseguridad impulsada por Mythos
Informe de Anthropic: la tasa de victorias en decisiones de IA sube al 64%, optimización de código 52 veces
Anthropic AI Claude escribe el 80% del código de producción a mayo de 2026