Validation X

Technique de validation de modèle (souvent abrégée « X-Val ») qui partitionne les données en plis afin d'évaluer rigoureusement la généralisation du modèle et de détecter le surajustement.

Définition

Méthode de validation croisée par k dans laquelle l'ensemble de données est divisé en k sous-ensembles ; le modèle est entraîné sur k—1 plis et validé sur le pli restant, en itérant de manière à ce que chaque sous-ensemble serve de validation une seule fois. Cela fournit des estimations fiables des performances et de la variance hors échantillon, aidant les équipes de gouvernance à définir des seuils de performance, à détecter le surajustement et à décider de l'état de préparation du modèle. Les résultats (moyenne et écart type entre les plis) sont documentés dans des rapports de validation.

Exemple concret

Une équipe d'analyse marketing applique 10 fois la validation X à son modèle de désabonnement des clients, signalant une AUC moyenne de 0,87 ± 0,02. La faible variance indique une généralisation stable ; ces résultats sont inclus dans le rapport de validation officiel requis par le Bureau de gouvernance de l'IA avant le déploiement en production.