Apprentissage distribué

Une approche d'apprentissage automatique dans laquelle les données d'entraînement sont distribuées sur plusieurs appareils ou sites, et les modèles sont entraînés de manière collaborative sans partager de données brutes.

Définition

Comprend l'apprentissage fédéré et l'apprentissage fractionné : chaque nœud s'entraîne localement sur des données privées et partage les mises à jour ou les intégrations de modèles avec un serveur central. Cela préserve la confidentialité des données et réduit la bande passante, mais nécessite une agrégation sécurisée, une gestion des dérivations et une gouvernance pour la validation des mises à jour afin d'empêcher les attaques de mises à jour empoisonnées.

Exemple concret

Un consortium de soins de santé met au point un modèle de prédiction des maladies dans cinq hôpitaux à l'aide de l'apprentissage fédéré. Chaque hôpital s'entraîne à partir des dossiers de ses patients localement, envoie des mises à jour de poids cryptées et le serveur central les regroupe, ce qui permet de créer un modèle robuste sans exposer les données des patients à l'extérieur.