Feature-Entwicklung

Erstellung, Auswahl oder Umwandlung von Rohdatensatzattributen in Funktionen, die die Leistung von Modellen für maschinelles Lernen verbessern.

Definition

Die Kunst und Wissenschaft, Domänendaten (Zeitstempel, Text, Sensorwerte) in aussagekräftige Eingaben umzuwandeln — Polynommerkmale zu erstellen, kategoriale Variablen zu kodieren, Interaktionsterme zu konstruieren oder Verteilungen zu normalisieren. Gutes Feature Engineering reduziert die Modellkomplexität, verbessert die Interpretierbarkeit und kann Domänenwissen einbetten. Die Steuerung muss die Feature-Abstammung verfolgen, Transformationen validieren und die Auswirkungen der Merkmalsdrift auf die Fairness des Modells bewerten.

Real-World Example

Ein Analyseteam für den Einzelhandel berechnet „days_since_last_purchase“ aus Transaktionsdaten und „average_spend_per_visit“ aus Verkaufsprotokollen. Diese Funktionen erhöhen den Rückruf des Modells zur Kundenabwanderung erheblich von 70 auf 85%, und eine klare Dokumentation stellt sicher, dass bei Audits zur Datenverwaltung jedes technische Feld bis zu den Rohquellen zurückverfolgt werden kann.