Qualité des données
État des données basé sur des facteurs tels que la précision, l'exhaustivité, la fiabilité et la pertinence, essentiels à la performance efficace des modèles d'IA.
Définition
Une mesure multidimensionnelle, comprenant l'exactitude (sans erreur), l'exhaustivité (aucune valeur manquante), la cohérence (formats uniformes), l'actualité (mise à jour) et la pertinence (adéquation à l'objectif). Les programmes de qualité des données déploient des règles de validation automatisées, des pipelines de nettoyage et des tableaux de bord de qualité, avec des procédures d'escalade lorsque les indicateurs tombent en dessous des seuils.
Exemple concret
Une équipe chargée du risque de crédit suit les indicateurs de qualité des données pour les domaines du revenu et de l'emploi dans les demandes de prêt. Lorsque les taux de valeurs manquantes dépassent 2 %, une alerte automatique déclenche un examen : les ingénieurs des données corrigent les scripts ETL et informent le personnel de première ligne pour qu'il applique les champs obligatoires, rétablissant ainsi l'intégralité des données avant la reconversion du modèle.