Reproductibilité

La capacité de régénérer de manière cohérente les résultats des modèles d'IA en utilisant les mêmes données, le même code et les mêmes configurations, garantissant ainsi la transparence et l'auditabilité.

Définition

Nécessite un contrôle de version strict du code, des données et de l'environnement (dépendances, matériel). Les pipelines automatisés capturent les métadonnées des expériences (graines aléatoires, hyperparamètres), enregistrent les artefacts dans des registres de modèles et permettent des rediffusions exactes. Les cadres de gouvernance imposent des normes de reproductibilité pour tous les modèles de production, avec des audits périodiques de la reproductibilité et des processus pour remédier à toute divergence.

Exemple concret

Un laboratoire de recherche utilise MLflow pour enregistrer le hachage de l'ensemble de données de chaque expérience, l'ID de validation du code, l'environnement Python et la valeur de départ aléatoire. Six mois plus tard, les auditeurs ont reconduit avec succès une expérience critique et ont reproduit l'exactitude publiée, démontrant ainsi une traçabilité et une reproductibilité complètes.