Information Fusion
Decentralized Federated Learning with Multimodal Prototypes for Heterogeneous Data
Decentralized Federated Learning (DFL) enables collaborative machine learning across numerous devices while avoiding bottlenecks and reliance on a single trusted entity inherent to centralized architectures. However, its...
Heterogeneous Clients
Clients possess non-IID local class distributions and incomplete modalities (some have only image & audio, others text & audio, etc.).
Optimization Losses
Key Empirical Results
Heterogeneous Clients
Local Encoding & Imputation
Prototype Construction
P2P Prototype Exchange
Knowledge Fusion & Loss
Local Model Update
Completa la progresión técnica hacia DFL multimodal heterogéneo: los clientes intercambian prototipos compactos conscientes de la modalidad en lugar de parámetros completos del modelo, conectando gestión de modalidades ausentes, alineación de representaciones, ponderación de modalidades y eficiencia de las comunicaciones.
+4.0%
mejora relativa de F1
Alta heterogeneidad frente al siguiente mejor método
82.1%
F1 solo imagen
Clientes unimodales en AVMNIST
0.11 MB
carga por cliente
Tamaño medio de mensaje por ronda
>40x
reducción de coste
Frente a métodos de referencia basados en modelos completos
Contribuciones científicas clave
- DFL multimodal descentralizado: Estudia la colaboración descentralizada cuando los clientes tienen distribuciones de clase non-IID y disponibilidad incompleta de modalidades.
- Protocolo centrado en prototipos: Intercambia prototipos compactos de clase conscientes de la modalidad en lugar de parámetros completos o actualizaciones completas del modelo.
- Robustez ante modalidades ausentes: Combina incrustaciones nulas contextuales, ponderación adaptativa de modalidades, fusión multimodal y objetivos de alineación de representaciones.
Conclusiones principales
- El intercambio de prototipos reportó aproximadamente 0.11 MB por mensaje de cliente, más de 40x menos que métodos de referencia intensivos en comunicación basados en intercambio de modelos completos.
- Los mecanismos evaluados apoyan la colaboración bajo modalidades ausentes, datos non-IID y configuraciones heterogéneas controladas.
- Las conclusiones permanecen vinculadas a los conjuntos de datos, configuraciones de modalidad, métodos de referencia y supuestos experimentales documentados.
Resultados empíricos (AVMNIST)
| Método | F1 score | Coste uplink / ronda |
|---|---|---|
| FedAvg | 69.5% | ~4.75 MB |
| FedProto | 74.8% | ~0.03 MB |
| Modalis | 83.4% | ~0.11 MB |
Fases metodológicas
Codificar
Embeddings multimodales locales e incrustaciones nulas contextuales
Prototipar
Prototipos compactos de clase intercambiados entre vecinos
Fusionar
Ponderación adaptativa de modalidades y alineación de representaciones
Resumen
Decentralized Federated Learning (DFL) enables collaborative machine learning across numerous devices while avoiding bottlenecks and reliance on a single trusted entity inherent to centralized architectures. However, its practical application is challenged by modern scenarios where data is increasingly multimodal. The key obstacles in such settings are severe data heterogeneity, characterized by non-Independent and Identically Distributed (non-IID) class distributions, and incomplete data, where modalities are often missing across clients. Existing solutions struggle with these challenges, either incurring high communication costs or lacking effective mechanisms for fusing partial information. To overcome these limitations, this work introduces Modalis, a novel framework for multimodal DFL that achieves superior model performance under data heterogeneity while minimizing network consumption. It pioneers a communication-efficient, prototype-centric protocol in which clients exchange compact, modality-aware class representations rather than high-dimensional model parameters. This process is guided by a multi-objective loss function enforcing inter-modality coherence and representation alignment for effective knowledge fusion. The framework integrates sophisticated architectural innovations, including contextual null embeddings for intelligent data imputation and robust multimodal fusion using adaptive gating and multi-way transformers. The approach is validated through theoretical analysis, providing formal convergence guarantees, and extensive experiments on standard multimodal benchmarks. These results demonstrate that Modalis achieves superior performance, improving F1 scores by up to 4% under high heterogeneity and reducing communication costs by over 40 times compared to state-of-the-art baselines, establishing it as a highly effective solution for collaborative AI.
Autores
Palabras clave
Publicaciones relacionadas
Trabajos cercanos por temática, tipo y solapamiento de etiquetas.
Expert Systems with Applications
Fedstellar: A Platform for Decentralized Federated Learning
Enrique Tomás Martínez Beltrán, Ángel Luis Perales Gómez, Chao Feng, Pedro Miguel Sánchez Sánchez, Sergio López Bernal, Gérôme Bovet, Manuel Gil Pérez, Gregorio Martínez Pérez, Alberto Huertas Celdrán
In 2016, Google proposed Federated Learning (FL) as a novel paradigm to train Machine Learning (ML) models across the participants of a federation while preserving data privacy. Since its birth, Centralized FL (CFL) has...
Computer Networks
Asynchronous Cache-based Aggregation with Fairness and Filtering for Decentralized Federated Learning
Enrique Tomás Martínez Beltrán, Eduard Gash, Gérôme Bovet, Alberto Huertas Celdrán, Burkhard Stiller
Decentralized Federated Learning (DFL) offers a scalable paradigm for collaborative intelligence at the edge, yet its practical efficacy is severely constrained by system heterogeneity. Traditional synchronous protocols...
Future Generation Computer Systems
FedEnD: Communication-efficient Federated Learning for non-IID data via decentralized ensemble distillation
Enrique Tomás Martínez Beltrán, Philip Giryes, Gérôme Bovet, Burkhard Stiller, Gregorio Martínez Pérez, Alberto Huertas Celdrán
Federated Learning (FL) offers a paradigm for collaborative AI that mitigates raw data exposure, yet the statistical heterogeneity of client data severely constrains its practical application. This non-independent and id...
Investigación relacionada

Abr 2023 — Nov 2023
DEFENDIS: aprendizaje federado descentralizado para identificación y seguridad de dispositivos IoT
DEFENDIS desarrolla un marco para identificar de forma distribuida dispositivos IoT y abordar amenazas de seguridad mediante aprendizaje federado descentralizado.

Nov 2025 — Ene 2026
Ciberseguridad y aprendizaje federado distribuido
Programa de intercambio internacional de investigación que investiga modelos de mitigación de amenazas para aprendizaje federado peer-to-peer.

Ene 2024 — Dic 2024
DATRIS: IA descentralizada para sistemas inteligentes confiables y eficientes en recursos
Desarrollo de soluciones de IA descentralizada abordando restricciones computacionales y validación de confianza bajo patrocinio de armasuisse.