Ciberataques a LLMs: Explotación de Proxies Mal Configurados y Riesgos SSRF

Cuando el punto de acceso, diseñado para proteger la maquinaria, se convierte en el vector de ataque más eficiente.

El reciente registro de más de 91,000 sesiones de ataque, identificadas entre octubre de 2025 y enero de 2026 por investigadores de GreyNoise, no apunta a fallos en la lógica intrínseca de los Modelos de Lenguaje Grandes (LLMs). La vulnerabilidad no reside en la creatividad del modelo, sino en su infraestructura perimetral. Los objetivos primarios de estas oleadas de ataques han sido los proxies mal configurados que actúan como fachada para servicios mayores como OpenAI y Gemini.

Este patrón de ataque representa un cambio tectónico en la ciberseguridad aplicada a la Inteligencia Artificial. Durante años, la preocupación se centró en el prompt injection. Ahora, vemos una consolidación de ataques orientados a la arquitectura de red subyacente. Los hackers no están tratando de engañar al algoritmo; están mapeando y penetrando el entorno de ejecución que lo soporta.

La Función Estructural del Proxy en el Despliegue de LLMs

Para entender la vulnerabilidad, primero debemos entender el papel crucial del proxy inverso en cualquier despliegue de LLMs a escala industrial. Un LLM rara vez se expone directamente a la Internet pública. Se utiliza un reverse proxy como capa de abstracción crítica. Sus funciones son múltiples: balanceo de carga, rate limiting para prevenir abusos de API, terminación SSL/TLS y, fundamentalmente, actuar como un cortafuegos de aplicación para inspeccionar y filtrar el tráfico.

Este proxy no es solo un intermediario; es el guardián de la red. Una configuración robusta asegura que solo las solicitudes válidas lleguen al entorno de ejecución del modelo (donde residen datos sensibles, claves API internas y la lógica de negocio). Una mala configuración, sin embargo, abre una puerta trasera hacia la red interna.

El error fatal no es tecnológico, sino operacional. El diseño del proxy es sólido, pero la negligencia en la implementación de políticas de seguridad estrictas convierte una fortaleza en un punto ciego para los atacantes. La arquitectura siempre paga el precio de la prisa.

El Vector de Ataque: Explotando las Debilidades de Egresos

Los investigadores han identificado dos campañas maliciosas principales que se apoyan en esta debilidad arquitectónica. Ambas buscan la misma meta: confirmar la existencia de un fallo de seguridad que permita al servidor realizar acciones no autorizadas.

1. El ‘Phoning Home’ y la Confirmación de Vulnerabilidad

La técnica conocida como ‘phoning home’ es un método elegante y eficiente para verificar una vulnerabilidad de Server-Side Request Forgery (SSRF). En esencia, el atacante inyecta una URL controlada por él mismo dentro de una solicitud que espera sea procesada por el servidor del LLM o el proxy. Si el servidor está configurado incorrectamente, intentará acceder a esa URL, estableciendo una conexión con el servidor del atacante.

Mecanismo SSRF: Un ataque SSRF ocurre cuando una aplicación web no valida la URL de entrada y realiza una solicitud arbitraria a un recurso especificado por el usuario. En el contexto de LLMs, esto suele explotar funciones internas que procesan contenido web (como APIs de recuperación o herramientas de navegación integradas) a las que se les permite acceder a recursos internos (como metadatos de AWS, servicios internos, o incluso credenciales de bases de datos).
Confirmación Silenciosa: Cuando el servidor ‘llama a casa’ (phoning home), el atacante recibe un registro HTTP en su servidor de escucha. Esta acción confirma no solo que la vulnerabilidad existe, sino también la dirección IP externa del servidor, el User-Agent y, a veces, incluso detalles sobre el entorno de la infraestructura interna. Es una herramienta crítica en la fase de reconocimiento.

2. Probing Masivo y Mapeo de Entorno

La segunda campaña observada consiste en un probing sistemático y masivo. Los atacantes están realizando barridos automatizados en busca de puntos finales de API específicos o configuraciones de LLMs que respondan de manera predecible a ciertas entradas. Esto no es un ataque ciego; es un esfuerzo concentrado para construir un mapa detallado del entorno de ejecución.

Este mapeo busca identificar qué modelos están disponibles (por ejemplo, modelos internos o versiones específicas de modelos fundacionales), cómo están segmentados y qué APIs internas son accesibles a través de rutas relativas o mal filtradas. Si un proxy falla al limitar el acceso a rutas como /admin o a servicios de telemetría interna, el atacante puede obtener información crítica sobre la arquitectura de la red.

Implicaciones Técnicas: El Colapso de la Segmentación

La consecuencia más grave de estos proxies mal configurados es el colapso efectivo de la segmentación de red. La segmentación es el principio de seguridad donde los diferentes componentes de un sistema se aíslan para que el compromiso de uno no lleve al compromiso total.

Si el proxy o el entorno de ejecución del LLM pueden ser forzados a realizar solicitudes a IPs internas (como 127.0.0.1, 169.254.169.254 para metadatos de AWS, o rangos privados de red), se abre una vía directa a:

Exfiltración de Credenciales: Los servicios en la nube a menudo exponen credenciales temporales o tokens de acceso a través de la API de metadatos (como IMDS en AWS o equivalentes en Azure/GCP). Un ataque SSRF exitoso permite al atacante robar estas credenciales, escalando privilegios fuera del entorno del LLM.
Acceso a Servicios Adyacentes: Bases de datos, sistemas de caché (Redis, Memcached) y otros microservicios que asumen seguridad por oscuridad o por estar detrás de un firewall son repentinamente accesibles. El atacante utiliza el servidor LLM comprometido como un trampolín.
Fuga de Datos de Entrenamiento: Aunque el acceso directo a los datos de entrenamiento puede ser difícil, el control sobre el entorno de ejecución eleva significativamente el riesgo de modificar o exfiltrar datos sensibles que el modelo procesa o referencia.

Hacia un Endurecimiento (Hardening) Arquitectónico

El análisis de estos 91,000 ataques debe servir como una alarma técnica para todos los operadores de infraestructura de IA. La solución no es parchar un solo fallo, sino reevaluar la arquitectura de seguridad del perímetro con un enfoque en el principio del mínimo privilegio (Principle of Least Privilege).

El endurecimiento se basa en tres pilares esenciales:

1. Filtrado de Egresos Riguroso (Egress Filtering)

El proxy debe implementar políticas de Egress Filtering estrictas. Esto significa que el proxy solo debe tener permiso para iniciar conexiones salientes a un conjunto muy limitado y explícito de destinos (listas blancas). Cualquier solicitud saliente a IPs privadas (RFC 1918) o a APIs de metadatos de la nube debe ser bloqueada de forma predeterminada.

2. Validación de Entrada Exhaustiva

Todas las URL y parámetros de entrada deben ser validados para prevenir la inyección de esquemas de red inusuales (como file://, gopher:// o IPs maliciosas). Herramientas como Web Application Firewalls (WAFs) deben configurarse para inspeccionar profundamente los cuerpos de las solicitudes en busca de patrones típicos de SSRF.

3. Aislamiento y Entornos Air-Gapped

El entorno de ejecución del LLM debería estar lo más segmentado posible de la red de producción más amplia. Idealmente, el servicio que interactúa con el modelo debería residir en una subred separada con un acceso de red muy restringido (prácticamente air-gapped) a cualquier recurso que no sea estrictamente necesario para su operación.

Mi experiencia en el análisis de sistemas perimetrales me lleva a una conclusión técnica ineludible: los operadores de LLMs han confiado demasiado en la robustez inherente de su plataforma en la nube y han descuidado la capa de aplicación más tradicional. Este es un fallo de ingeniería básica, no de la complejidad de la IA.

El volumen de ataques demuestra que los actores maliciosos ya están realizando reconocimiento a escala industrial, tratando de catalogar cada posible punto de entrada. Ignorar esta oleada de probing es asumir un riesgo inaceptable. Es hora de revisar cada línea de código en las configuraciones de los proxies y de aplicar el principio de defensa en profundidad. La seguridad de la IA empieza en la capa 3 y 4 del modelo OSI, no en la capa de la aplicación.