Tests et validation
Processus systématique d'évaluation des modèles d'IA par rapport à des points de référence, à des cas extrêmes et à des conditions de stress afin de s'assurer qu'ils répondent aux critères de performance, de sécurité et de conformité.
Définition
Comprend des tests unitaires pour des composants individuels, des tests d'intégration pour les pipelines de données, des tests de régression par rapport à des données historiques, des scénarios extrêmes (antagonistes, événements rares) et des tests de résistance sur l'évolutivité et la sécurité. La validation comprend des mesures statistiques de performance, des audits d'équité et des contrôles de conformité. La gouvernance veille à ce qu'aucun modèle n'atteigne la production sans passer par une liste de contrôle complète de test et de validation approuvée par des évaluateurs indépendants.
Exemple concret
La suite de tests d'un modèle de risque de crédit comprend : une validation des données de prêt récentes ; des tests de résistance avec des scénarios de ralentissement économique simulés ; des tests de biais entre les revenus et les groupes démographiques ; et des tests de charge d'API. Ce n'est qu'après avoir franchi toutes les étapes que le modèle reçoit l'approbation finale pour le déploiement.