Désidentification
Le processus qui consiste à supprimer ou à masquer les identificateurs personnels des ensembles de données, ce qui rend difficile l'identification des personnes, est utilisé pour protéger la vie privée.
Définition
Les techniques incluent la pseudonymisation (remplacement des identifiants par des clés), le k-anonymat (garantie que les enregistrements partagent des valeurs d'attributs), la généralisation (élargissement de la granularité des données) et la suppression (omission des champs sensibles). Une désidentification efficace concilie confidentialité et utilité des données, et nécessite des évaluations des risques de réidentification au moyen de techniques de réidentification évolutives.
Exemple concret
Une ville publie des journaux de transit anonymisés en remplaçant les identifiants des utilisateurs par des jetons aléatoires et en regroupant les emplacements sur des grilles de 1 km. Des tests de réidentification périodiques confirment qu'aucun trajet ne peut être retracé, ce qui permet d'utiliser des données ouvertes sans compromettre la confidentialité des passagers.