Traitement du langage naturel (NLP)
Techniques et outils qui permettent aux machines d'interpréter, de générer et d'analyser le langage humain sous forme de texte ou de parole.
Définition
Domaine combinant la linguistique et l'apprentissage automatique pour traiter des données linguistiques non structurées. Les tâches incluent la tokenisation, le balisage d'une partie du discours, l'analyse syntaxique, la reconnaissance d'entités nommées, l'analyse des sentiments et la génération de langage. La gouvernance se concentre sur la provenance des données, les biais dans les modèles linguistiques, la confidentialité des textes sensibles et une évaluation rigoureuse de divers ensembles de données linguistiques afin de garantir des capacités linguistiques robustes, équitables et sécurisées.
Exemple concret
Un centre de service client utilise un pipeline NLP pour acheminer automatiquement les demandes : le texte est symbolisé et classé en « facturation », « support technique » ou « commentaires ». Le système signale les classifications à faible niveau de confiance pour une évaluation humaine. Des audits trimestriels vérifient que la précision du routage reste supérieure à 90 % dans toutes les langues prises en charge, évitant ainsi les demandes mal acheminées.