Saltar al contenido
Enrique Tomás Martínez Beltrán
InicioInvestigaciónPublicacionesDocenciaBlog
ENES
Contacto
InicioInvestigaciónPublicacionesDocenciaBlog
ENES
Contacto

Enrique Tomás Martínez Beltrán

Investigación en aprendizaje federado, IA confiable y ciberdefensa, con foco en sistemas robustos, con preservación de privacidad y útiles en operaciones de seguridad.

  • Política de privacidad
  • Términos del servicio
  • Accesibilidad
  • GitHubse abre en una pestaña nueva
  • LinkedInse abre en una pestaña nueva
  • Google Scholarse abre en una pestaña nueva
  • RGse abre en una pestaña nueva
  • ORCIDse abre en una pestaña nueva
  • Scopusse abre en una pestaña nueva
  • DBLPse abre en una pestaña nueva
  • Web of Sciencese abre en una pestaña nueva

Enrique Tomás Martínez Beltrán. Todos los derechos reservados.

Volver arriba

Este sitio carga analítica opcional de Google y proveedores externos de analítica solo si aceptas. Puedes rechazarla y seguir usando la web con normalidad.

  1. Inicio
  2. Notas de investigación sobre aprendizaje federado, ciberseguridad y ciberdefensa
  3. De la monitorización a la mitigación: ciclo de ciberdefensa DFL con explicaciones mediante LLMs
Aprendizaje federado descentralizadoLLMsIA explicableMitigación de ataquesCiberdefensa

De la monitorización a la mitigación: ciclo de ciberdefensa DFL con explicaciones mediante LLMs

Conectando telemetría, entrenamiento federado, inferencia, detección de alertas, explicaciones y recomendaciones de mitigación

Enrique Tomás Martínez Beltrán

Investigador predoctoral en aprendizaje federado y ciberseguridad

30 de mayo de 20268 min de lectura
  • LinkedInse abre en una pestaña nueva
  • Xse abre en una pestaña nueva
De la monitorización a la mitigación: ciclo de ciberdefensa DFL con explicaciones mediante LLMs

La ciberdefensa no termina cuando un modelo predice una anomalía. Un sistema útil necesita un ciclo: monitorizar el entorno, entrenar o actualizar modelos, ejecutar inferencia, detectar alertas, explicar la situación, recomendar mitigaciones y devolver el resultado al siguiente ciclo de entrenamiento.

Ahí es donde el aprendizaje federado descentralizado empieza a ser útil más allá de la fase de entrenamiento.

1. Monitorización

La primera capa es la monitorización distribuida. Nodos edge, sensores, funciones de red, drones, gateways IoT o controladores industriales observan comportamiento local y generan telemetría. La restricción importante es que no todos los participantes pueden o deben centralizar datos brutos.

La monitorización debería recoger estructura suficiente para apoyar decisiones de seguridad:

  • indicadores de anomalía,
  • marcas temporales,
  • contexto local,
  • confianza del modelo,
  • señales de confianza entre peers,
  • resultado de mitigaciones.

2. Entrenamiento federado

En lugar de enviar toda la telemetría a un repositorio central, cada participante entrena localmente y comparte actualizaciones acotadas del modelo. En DFL, la agregación puede ocurrir peer-to-peer o mediante topologías semidescentralizadas, eliminando una dependencia central única.

La pregunta de seguridad no es solo la precisión. El sistema debe gestionar poisoning, actualizaciones retrasadas, peers no fiables y datos locales non-IID.

3. Inferencia y detección de alertas

La inferencia debería ejecutarse cerca del entorno monitorizado cuando la latencia importa. Las alertas deberían incluir score del modelo, contexto local y evidencia que provocó la escalada.

Una alerta es débil si solo dice "ataque". Es más fuerte cuando indica:

  • qué cambió,
  • dónde cambió,
  • qué confianza tiene el modelo,
  • si otros peers ven patrones similares,
  • qué mitigaciones están disponibles.

4. Uso de LLMs para apoyar la mitigación

Los LLMs no deberían sustituir al detector ni ejecutar acciones defensivas por sí solos. Un papel más realista es situarlos después de la detección para convertir evidencia técnica en una explicación del ataque, algunas hipótesis plausibles y opciones de mitigación para un operador.

Una capa LLM útil debería recibir contexto de seguridad estructurado, no prompts vagos. Puede producir:

  • resumen en lenguaje claro,
  • hipótesis probables de ataque,
  • caveats de confianza,
  • acciones de mitigación recomendadas,
  • enlaces a playbooks,
  • preguntas para el analista humano.

Un paquete mínimo de evidencia podría tener esta forma:

Text
Ventana de telemetría -> inferencia DFL local -> score de anomalía
  -> comprobaciones de acuerdo entre peers y deriva
  -> paquete de evidencia: activo, ventana temporal, síntomas, confianza, restricciones
  -> explicación y opciones de mitigación apoyadas por un LLM
  -> aprobación o rechazo del analista
  -> resultado de mitigación registrado para el siguiente ciclo de aprendizaje

Por ejemplo, si varios nodos edge informan de ráfagas anómalas de autenticación e intentos de conexión lateral, el LLM no debería "decidir" la respuesta. Debería resumir la evidencia, relacionarla con etapas plausibles del ataque, sugerir opciones acotadas como aislar un segmento o aumentar la monitorización, y dejar la decisión al analista.

5. Mitigación y feedback

La mitigación debe ser explícita: bloquear, aislar, limitar tráfico, rotar claves, cambiar políticas, activar monitorización extra o seguir observando. Un LLM puede ayudar a explicar por qué una mitigación es plausible, qué evidencia la respalda y qué riesgo queda, pero la acción debería estar acotada por playbooks aprobados y supervisión humana. El resultado de esa mitigación vuelve como feedback al siguiente ciclo de entrenamiento y evaluación.

El objetivo no es un sistema autónomo opaco. El objetivo es un bucle trazable donde DFL aporta aprendizaje colaborativo, los modelos de detección aportan evidencia y los LLMs ayudan a humanos a entender el ataque y comparar mitigaciones con más rapidez.

Idea clave

El papel útil de los LLMs es concreto y operativo: traducir evidencia de seguridad estructurada en contexto comprensible del ataque y opciones de mitigación acotadas, mientras DFL y los modelos de detección siguen siendo responsables del aprendizaje y de la evidencia de alerta.

Pregunta abierta de investigación

¿Cómo evaluar estos pasos de mitigación apoyada por LLMs para asegurar que las explicaciones sean fieles a la evidencia y las recomendaciones permanezcan dentro de playbooks operativos aprobados?

Regla de diseño

Trata el LLM como apoyo para explicación y mitigación, no como autoridad de detección. Un ciclo práctico sería: telemetría -> modelo DFL -> evidencia de alerta -> explicación con LLM -> opciones de mitigación -> aprobación humana -> feedback.

Investigación relacionada

Situational awareness para ciberdefensa con aprendizaje federado descentralizado

29 de mayo de 2026

Situational awareness para ciberdefensa con aprendizaje federado descentralizado

Nota de investigación sobre el uso de DFL para convertir telemetría distribuida, anomalías y señales de confianza en situational awareness de ciberdefensa.

Drones, inteligencia en edge y DFL para operaciones de ciberdefensa

28 de mayo de 2026

Drones, inteligencia en edge y DFL para operaciones de ciberdefensa

Nota técnica sobre cómo flotas de drones pueden usar DFL para colaborar en modelos de detección sin exponer telemetría de misión.