Ingénierie des fonctionnalités
Création, sélection ou transformation d'attributs de jeu de données bruts en fonctionnalités qui améliorent les performances des modèles d'apprentissage automatique.
Définition
L'art et la science de convertir des données de domaine (horodatages, texte, lectures de capteurs) en entrées significatives, en créant des caractéristiques polynomiales, en codant des variables catégorielles, en élaborant des termes d'interaction ou en normalisant des distributions. Une bonne ingénierie des fonctionnalités réduit la complexité des modèles, améliore l'interprétabilité et peut intégrer des connaissances du domaine. La gouvernance doit suivre la généalogie des fonctionnalités, valider les transformations et évaluer les impacts de la dérive des fonctionnalités sur l'équité des modèles.
Exemple concret
Une équipe d'analyse du commerce de détail conçoit « days_since _last_purchase » à partir des dates de transaction et « average_spend_per_visit » à partir des journaux de ventes. Ces fonctionnalités augmentent considérablement le taux de rappel lié au modèle de désabonnement des clients, de 70 % à 85 %, et une documentation claire garantit que les audits de gouvernance des données peuvent retracer chaque champ d'ingénierie jusqu'aux sources brutes.