Se entiende por entrenamiento con datos federados a un contexto muy concreto de proceso de entrenamiento en el que los datos están distribuidos disjuntamente entre distintos nodos. Esto hace que, el algoritmo que vayamos a entrenar, no pueda ver todos los datos al mismo tiempo, lo que implica cambiar la estrategia de entrenamiento, buscando evitar los sesgos. Es un paradigma en el que distintos entes, como distintas empresas, pueden aprovechar los datos de la otra sin que eso implique una compartición directa de información.