Anthropic expande Claude Mythos a infraestructuras críticas: ¿seguridad o nuevo riesgo?

La delgada línea entre auditar tu seguridad y entregarle las llaves de tu casa al algoritmo.

El día en que confiamos nuestra luz y nuestra agua a una mente artificial

Imagínate por un momento que vives en una casa con una cerradura muy compleja. Sabes que no es perfecta y que algún día un ladrón habilidoso podría descifrarla, pero te mantiene a salvo por ahora. Una mañana, una empresa de alta tecnología toca a tu puerta y te propone un trato tentador: “Vamos a enviar a un cerrajero invisible, ultraveloz y superinteligente para que analice cada rendija, tornillo y bisagra de tu hogar. Él encontrará los fallos antes que los criminales y fabricará parches al instante”. Suena fantástico, ¿verdad? Pero hay un truco que no te cuentan: ese cerrajero almacena en su cabeza los planos exactos y las debilidades de tu casa, junto con las de miles de viviendas de tu ciudad.

Esto ya no es ciencia ficción ni una parábola exagerada. Es lo que está ocurriendo hoy, 3 de junio de 2026. La conocida firma de inteligencia artificial Anthropic ha dado un paso de gigante al expandir el acceso de su modelo Claude Mythos Preview a cerca de 150 nuevas organizaciones a través de una iniciativa confidencial bautizada como Project Glasswing. Y no estamos hablando de startups de diseño de moda o empresas de marketing digital. Esta vez, las llaves de la fortaleza se han entregado a operadores de infraestructuras críticas de energía, agua, salud y telecomunicaciones en más de 15 países.

¿Qué es Claude Mythos y por qué debería preocuparte?

Para entender el alcance real de esta noticia, es necesario quitarle el envoltorio de relaciones públicas y lenguaje corporativo. Claude Mythos no es el típico asistente virtual al que le pides que redacte un correo o que resuma una reunión aburrida. Estamos ante un modelo entrenado específicamente para analizar código fuente, identificar fallos de seguridad complejos, redactar parches correctivos de forma autónoma y realizar pruebas de penetración automáticas en sistemas críticos.

En la jerga de ciberseguridad, esto significa buscar vulnerabilidades del “día cero”, esos agujeros invisibles que los desarrolladores no saben que existen hasta que alguien los explota para causar un desastre. Tradicionalmente, este trabajo requería de equipos humanos de élite, analistas de seguridad que pasaban semanas revisando líneas de código. Ahora, Anthropic pretende que un algoritmo haga esto en cuestión de segundos y a escala masiva.

Mi primera impresión al conocer los detalles de Project Glasswing fue de profunda inquietud. Me puse a pensar en cómo cambia el equilibrio de poder en la red cuando automatizas tanto la defensa como el análisis de ataques. La tecnología, como siempre digo, es una herramienta neutral. Pero quienes la diseñan y la operan están sujetos a fallos humanos, presiones comerciales y ataques dirigidos. Si un modelo de IA aprende a encontrar la debilidad perfecta en un sistema de distribución de agua potable, ese conocimiento se codifica y existe en un servidor. Y en nuestro mundo interconectado, todo lo que se almacena digitalmente corre el riesgo de ser filtrado, robado o interceptado.

La centralización del peligro: ¿Qué significa esto para tu privacidad?

Es muy fácil caer en la trampa de pensar: “Yo no administro una central eléctrica ni un hospital, esto no me afecta”. Pero la realidad es mucho más cercana y cruda. Si el suministro eléctrico de tu localidad se interrumpe durante varios días debido a un fallo en el software de control, o si los sistemas de tu centro de salud local caen por un ataque de secuestro de datos, tu vida diaria se detiene por completo. Ahí es donde la ciberseguridad abstracta se convierte en un problema físico, tangible y peligroso.

El gran problema de la iniciativa de Anthropic no es que la empresa tenga malas intenciones. Al contrario, prevenir ataques es una causa noble. El peligro real reside en la creación de un punto único de fallo. Imagina que un grupo de ciberdelincuentes patrocinados por un estado extranjero consigue infiltrarse en los sistemas de Anthropic o alterar las respuestas que Claude Mythos ofrece a los operadores. En ese instante, tendrían acceso a un inventario detallado de las mayores debilidades de la infraestructura civil de medio planeta.

“Confiar la seguridad de nuestros servicios esenciales a un único guardián algorítmico es el equivalente digital a guardar todas las llaves de la ciudad en un solo llavero y dejarlo junto a una ventana abierta.”

Además, Anthropic ha mencionado que está evaluando cómo ayudar a los desarrolladores de código abierto a gestionar los reportes de vulnerabilidades. Esto me parece un terreno extremadamente resbaladizo. El software libre sostiene la columna vertebral del internet moderno, y limpiarlo de errores es vital. Sin embargo, si automatizamos las alertas y los parches mediante un modelo comercial cerrado, creamos una dependencia peligrosa. ¿Qué pasa si una actualización automática introduce un fallo aún mayor sin supervisión humana directa? El remedio podría acabar siendo mucho más destructivo que la enfermedad.

El espejismo de la seguridad automatizada y sin humanos

Llevo años analizando sistemas y trasteando con diferentes herramientas de seguridad, y siempre llego a la misma conclusión: la comodidad es el peor enemigo de la protección real. Nos encanta la idea de delegar tareas complejas en la inteligencia artificial porque nos ahorra tiempo y costes operativos. Pero la ciberseguridad no es una ciencia exacta de ceros y unos; es un juego constante del gato y el ratón donde el contexto humano, la intuición y la redundancia lo son todo.

Cuando dependes de que una IA escriba tus parches de seguridad, estás asumiendo que el modelo siempre tomará la decisión correcta y que no será víctima de técnicas de manipulación como la inyección de prompts. Si un atacante descubre cómo engañar al modelo para que ignore un fallo específico o para que introduzca una puerta trasera sutil en el parche que acaba de generar, habremos automatizado nuestra propia caída.

Cómo prepararte ante un entorno crítico cada vez más automatizado

Aunque como ciudadanos individuales no podemos decidir qué herramientas de software eligen las grandes multinacionales de energía o los gobiernos, sí que podemos aplicar principios de higiene digital para mitigar el impacto de un fallo sistémico. Aquí tienes una serie de recomendaciones prácticas para proteger tu entorno doméstico:

Evita la centralización en tu vida digital: No utilices un único proveedor para todos tus servicios esenciales. Si usas un gestor de contraseñas, asegúrate de tener copias de seguridad locales y seguras fuera de la nube.
Implementa la redundancia analógica: Asegúrate de que los aspectos críticos de tu hogar o tu pequeño negocio puedan funcionar de forma manual si la conexión a internet o los sistemas inteligentes fallan temporalmente.
Desconfía de las actualizaciones automáticas críticas: En la medida de lo posible, configura tus dispositivos más importantes para que soliciten tu aprobación antes de instalar parches de sistema significativos. Un minuto de revisión puede salvarte de un desastre de compatibilidad.
Cuestiona el uso de IA en tus servicios: Pregunta a tus proveedores de servicios de salud, finanzas o telecomunicaciones qué medidas de control y supervisión humana aplican sobre los algoritmos que gestionan sus infraestructuras de seguridad.

Reflexión final: el guardián que nunca duerme, pero que tampoco siente

Project Glasswing de Anthropic pone sobre la mesa una realidad ineludible: la inteligencia artificial ha dejado de ser un asistente de oficina para convertirse en el custodio de las estructuras que mantienen en pie nuestra sociedad. La intención de blindar los sistemas antes de que ocurra un ataque catastrófico es comprensible, pero delegar la soberanía de la defensa en un sistema de caja negra es un riesgo inaceptable a largo plazo.

La verdadera ciberseguridad se construye con diversidad, descentralización y, sobre todo, con la inestimable supervisión de profesionales humanos que comprenden las consecuencias reales de sus decisiones. No podemos permitir que el miedo a los atacantes nos empuje a entregar el control absoluto a un guardián invisible cuya lealtad y estabilidad nunca podremos garantizar al cien por cien.