Gestion des métadonnées
Pratique consistant à saisir et à conserver des données descriptives (par exemple, provenance des données, définitions des caractéristiques, paramètres du modèle) pour faciliter la traçabilité et les audits.
Définition
Mise en œuvre de registres de métadonnées qui collectent des informations de lignage (ensembles de données sources, étapes de transformation), des catalogues de fonctionnalités (définitions, types de données), des artefacts de modèles (hyperparamètres, versions de code d'apprentissage) et des journaux d'utilisation. La gouvernance impose la saisie obligatoire des métadonnées à chaque étape du pipeline, intègre des contrôles de validation des métadonnées et fournit des interfaces de recherche et de reporting permettant aux parties prenantes de réaliser des audits et des analyses d'impact.
Exemple concret
Une plateforme de machine learning pharmaceutique utilise un magasin de métadonnées pour enregistrer : les versions des ensembles de données, les scripts d'ingénierie des fonctionnalités, les commits Git d'entraînement des modèles et les horodatages de déploiement. Lorsque les performances d'un modèle diminuent, les enquêteurs interrogent le magasin de métadonnées pour identifier les données exactes ou les modifications de code responsables.