Inférence
Processus par lequel un modèle d'IA entraîné traite de nouvelles entrées de données pour produire des prévisions ou des décisions.
Définition
Étape d'exécution au cours de laquelle les modèles appliquent les paramètres appris à des données invisibles, souvent dans des conditions strictes de latence, de débit et de ressources. La gouvernance par inférence garantit que les modèles de production utilisent la bonne version, respectent les SLA en matière de performances, enregistrent les entrées/sorties à des fins de surveillance et appliquent des contrôles de validation des entrées pour empêcher les abus ou les attaques par injection.
Exemple concret
Un service de détection des fraudes expose une API REST à des fins d'inférence. Il intègre le modèle dans un microservice qui vérifie les schémas d'entrée, enregistre chaque demande et réponse avec des métadonnées, et évolue horizontalement pour maintenir des temps de réponse inférieurs à 100 ms pendant les pics de transactions.