Verteiltes Lernen

Ein maschineller Lernansatz, bei dem Trainingsdaten auf mehrere Geräte oder Standorte verteilt werden und Modelle gemeinsam trainiert werden, ohne Rohdaten auszutauschen.

Definition

Beinhaltet föderiertes Lernen und geteiltes Lernen: Jeder Knoten trainiert lokal mit privaten Daten und teilt Modellaktualisierungen oder Einbettungen mit einem zentralen Server. Das schützt den Datenschutz und reduziert die Bandbreite, erfordert jedoch eine sichere Aggregation, Drift-Handling und Governance für die Aktualisierungsvalidierung, um Poisoned-Update-Angriffe zu verhindern.

Real-World Example

Ein Gesundheitskonsortium trainiert mithilfe von Verbundlernen in fünf Krankenhäusern ein Krankheitsvorhersagemodell. Jedes Krankenhaus trainiert seine Patientendaten vor Ort, sendet verschlüsselte Gewichtsinformationen, und der zentrale Server fasst sie zusammen. So ist ein robustes Modell möglich, ohne dass Patientendaten extern zugänglich gemacht werden.