Surveillance continue
Suivi continu des performances des systèmes d'IA, de la dérive des données, des indicateurs de biais et des événements de sécurité afin de détecter et de gérer les risques émergents au fil du temps.
Définition
Comprend la surveillance des modèles (précision, dérive), l'état du pipeline de données (échecs d'ingestion), les évaluations de l'équité (disparité démographique) et les alertes de sécurité (détections d'intrusion). La surveillance continue utilise des tableaux de bord, des alertes automatisées et des examens périodiques. Les mandats de gouvernance surveillent les exigences de couverture, les définitions des seuils, les modes de réponse aux incidents et la production de rapports réguliers aux organismes de surveillance.
Exemple concret
Une plateforme de commerce électronique surveille quotidiennement son moteur de recommandation pour détecter toute baisse de précision, tout biais dans le segment d'utilisateurs et les erreurs d'exécution. Les tableaux de bord personnalisés affichent toutes les mesures ; lorsqu'une métrique dépasse son seuil, l'équipe ML Ops reçoit une alerte Slack et suit un protocole de réponse aux incidents prédéfini pour enquêter et y remédier.