Unbeaufsichtigtes Lernen

Ein maschineller Lernansatz, bei dem Modelle Muster oder Gruppierungen in unbeschrifteten Daten ohne explizite Ergebnisorientierung identifizieren.

Definition

Techniken (z. B. Clustering, Reduzierung der Dimensionalität, Erkennung von Anomalien), die die intrinsische Struktur von Daten aufdecken, indem sie Ziele wie Clusterkohäsion oder Rekonstruktionsfehler optimieren. Zu den Überlegungen zur Unternehmensführung gehören die Validierung entdeckter Muster anhand von Fachkenntnissen, die Überwachung auf falsche oder voreingenommene Gruppierungen und die Sicherstellung der Datenqualität, da es keine Labels gibt, mit denen Fehler automatisch erkannt werden könnten. Sie müssen die Auswahl des Algorithmus, die Parametereinstellungen und die zur Überprüfung der Ergebnisse verwendeten Werkzeuge zur Interpretierbarkeit dokumentieren.

Real-World Example

Eine Einzelhandelskette verwendet K-Means-Clustering anhand der Kaufhistorie von Kunden, um Käufer in verhaltensbasierte Gruppen zu unterteilen. Analysten validieren Segmente anhand demografischer Umfragen und passen die Anzahl der Cluster an, um aussagekräftige Marketing-Personas zu gewährleisten und irreführende Gruppierungen aufgrund von Datenartefakten zu vermeiden.