Artículo de revista2026

Information Fusion

Decentralized Federated Learning with Multimodal Prototypes for Heterogeneous Data

Aprendizaje federado descentralizadoMultimodal DataHeterogeneous DataNon-IID DataIncomplete DataPrototype-Centric CommunicationMulti-Objective LossContextual Null EmbeddingsMultimodal FusionConvergence Analysis

Scientific overview

Live • Tick 0

Modalis Lens • Step 1 of 6

Heterogeneous Clients

Clients possess non-IID local class distributions and incomplete modalities (some have only image & audio, others text & audio, etc.).

Optimization Losses

Federated Alignment LossL_FAL

Discriminative Contrastive LossL_DCL

Modality Coherence LossL_MCL

Prototype RegularizationL_PR

Key Empirical Results

F1 Score GainRelative gain over the next-best competing method under high heterogeneity.

+4.0%

Communication SavingsReported reduction by sharing compact class prototypes instead of full model parameters.

>40x

Missing ModalitiesEvaluated setting where 50% of modalities may be missing.

pm=0.5

Heterogeneous Clients
Local Encoding & Imputation
Prototype Construction
P2P Prototype Exchange
Knowledge Fusion & Loss
Local Model Update

Resumen científico

RQ3 · RQ4

Completa la progresión técnica hacia DFL multimodal heterogéneo: los clientes intercambian prototipos compactos conscientes de la modalidad en lugar de parámetros completos del modelo, conectando gestión de modalidades ausentes, alineación de representaciones, ponderación de modalidades y eficiencia de las comunicaciones.

Ver animación

+4.0%

mejora relativa de F1

Alta heterogeneidad frente al siguiente mejor método

82.1%

F1 solo imagen

Clientes unimodales en AVMNIST

0.11 MB

carga por cliente

Tamaño medio de mensaje por ronda

>40x

reducción de coste

Frente a métodos de referencia basados en modelos completos

Contribuciones científicas clave

DFL multimodal descentralizado: Estudia la colaboración descentralizada cuando los clientes tienen distribuciones de clase non-IID y disponibilidad incompleta de modalidades.
Protocolo centrado en prototipos: Intercambia prototipos compactos de clase conscientes de la modalidad en lugar de parámetros completos o actualizaciones completas del modelo.
Robustez ante modalidades ausentes: Combina incrustaciones nulas contextuales, ponderación adaptativa de modalidades, fusión multimodal y objetivos de alineación de representaciones.

Conclusiones principales

El intercambio de prototipos reportó aproximadamente 0.11 MB por mensaje de cliente, más de 40x menos que métodos de referencia intensivos en comunicación basados en intercambio de modelos completos.
Los mecanismos evaluados apoyan la colaboración bajo modalidades ausentes, datos non-IID y configuraciones heterogéneas controladas.
Las conclusiones permanecen vinculadas a los conjuntos de datos, configuraciones de modalidad, métodos de referencia y supuestos experimentales documentados.

Resultados empíricos (AVMNIST)

Método	F1 score	Coste uplink / ronda
FedAvg	69.5%	~4.75 MB
FedProto	74.8%	~0.03 MB
Modalis	83.4%	~0.11 MB

Fases metodológicas

Codificar

Embeddings multimodales locales e incrustaciones nulas contextuales

Prototipar

Prototipos compactos de clase intercambiados entre vecinos

Fusionar

Ponderación adaptativa de modalidades y alineación de representaciones

Resumen

Decentralized Federated Learning (DFL) enables collaborative machine learning across numerous devices while avoiding bottlenecks and reliance on a single trusted entity inherent to centralized architectures. However, its practical application is challenged by modern scenarios where data is increasingly multimodal. The key obstacles in such settings are severe data heterogeneity, characterized by non-Independent and Identically Distributed (non-IID) class distributions, and incomplete data, where modalities are often missing across clients. Existing solutions struggle with these challenges, either incurring high communication costs or lacking effective mechanisms for fusing partial information. To overcome these limitations, this work introduces Modalis, a novel framework for multimodal DFL that achieves superior model performance under data heterogeneity while minimizing network consumption. It pioneers a communication-efficient, prototype-centric protocol in which clients exchange compact, modality-aware class representations rather than high-dimensional model parameters. This process is guided by a multi-objective loss function enforcing inter-modality coherence and representation alignment for effective knowledge fusion. The framework integrates sophisticated architectural innovations, including contextual null embeddings for intelligent data imputation and robust multimodal fusion using adaptive gating and multi-way transformers. The approach is validated through theoretical analysis, providing formal convergence guarantees, and extensive experiments on standard multimodal benchmarks. These results demonstrate that Modalis achieves superior performance, improving F1 scores by up to 4% under high heterogeneity and reducing communication costs by over 40 times compared to state-of-the-art baselines, establishing it as a highly effective solution for collaborative AI.

Autores

Enrique Tomás Martínez BeltránGérôme BovetGregorio Martínez PérezAlberto Huertas Celdrán

Palabras clave

Publicaciones relacionadas

Trabajos cercanos por temática, tipo y solapamiento de etiquetas.

Artículo de revista2024

Expert Systems with Applications

Fedstellar: A Platform for Decentralized Federated Learning

Enrique Tomás Martínez Beltrán, Ángel Luis Perales Gómez, Chao Feng, Pedro Miguel Sánchez Sánchez, Sergio López Bernal, Gérôme Bovet, Manuel Gil Pérez, Gregorio Martínez Pérez, Alberto Huertas Celdrán

In 2016, Google proposed Federated Learning (FL) as a novel paradigm to train Machine Learning (ML) models across the participants of a federation while preserving data privacy. Since its birth, Centralized FL (CFL) has...

Editorial DOI

Artículo de revista2026

Computer Networks

Asynchronous Cache-based Aggregation with Fairness and Filtering for Decentralized Federated Learning

Enrique Tomás Martínez Beltrán, Eduard Gash, Gérôme Bovet, Alberto Huertas Celdrán, Burkhard Stiller

Decentralized Federated Learning (DFL) offers a scalable paradigm for collaborative intelligence at the edge, yet its practical efficacy is severely constrained by system heterogeneity. Traditional synchronous protocols...

Editorial DOI

Artículo de revista2026

Future Generation Computer Systems

FedEnD: Communication-efficient Federated Learning for non-IID data via decentralized ensemble distillation

Enrique Tomás Martínez Beltrán, Philip Giryes, Gérôme Bovet, Burkhard Stiller, Gregorio Martínez Pérez, Alberto Huertas Celdrán

Federated Learning (FL) offers a paradigm for collaborative AI that mitigates raw data exposure, yet the statistical heterogeneity of client data severely constrains its practical application. This non-independent and id...

Editorial DOI

Investigación relacionada

Abr 2023 — Nov 2023

Método

F1 score

Coste uplink / ronda

FedAvg

69.5%

~4.75 MB

FedProto

74.8%

~0.03 MB

Modalis

83.4%

~0.11 MB

Decentralized Federated Learning with Multimodal Prototypes for Heterogeneous Data

Heterogeneous Clients

Contribuciones científicas clave

Conclusiones principales

Resultados empíricos (AVMNIST)

Fases metodológicas

Resumen

Autores

Palabras clave

Publicaciones relacionadas

Fedstellar: A Platform for Decentralized Federated Learning

Asynchronous Cache-based Aggregation with Fairness and Filtering for Decentralized Federated Learning

FedEnD: Communication-efficient Federated Learning for non-IID data via decentralized ensemble distillation

Investigación relacionada

DEFENDIS: aprendizaje federado descentralizado para identificación y seguridad de dispositivos IoT

Ciberseguridad y aprendizaje federado distribuido

DATRIS: IA descentralizada para sistemas inteligentes confiables y eficientes en recursos

Decentralized Federated Learning with Multimodal Prototypes for Heterogeneous Data

Heterogeneous Clients

Contribuciones científicas clave

Conclusiones principales

Resultados empíricos (AVMNIST)

Fases metodológicas

Resumen

Autores

Palabras clave

Publicaciones relacionadas

Fedstellar: A Platform for Decentralized Federated Learning

Asynchronous Cache-based Aggregation with Fairness and Filtering for Decentralized Federated Learning

FedEnD: Communication-efficient Federated Learning for non-IID data via decentralized ensemble distillation

Investigación relacionada

DEFENDIS: aprendizaje federado descentralizado para identificación y seguridad de dispositivos IoT

Ciberseguridad y aprendizaje federado distribuido

DATRIS: IA descentralizada para sistemas inteligentes confiables y eficientes en recursos