Confidentialité différentielle

Système permettant de partager publiquement des informations sur un ensemble de données en décrivant des modèles de groupes au sein de l'ensemble de données tout en ne divulguant pas d'informations sur des individus.

Définition

Formalise les garanties de confidentialité en ajoutant du bruit calibré aux résultats des requêtes (par exemple, les comptes, les moyennes) afin que la présence ou l'absence d'une seule personne dans l'ensemble de données ne puisse être déduite. Les paramètres de confidentialité différentiels (ε, δ) quantifient la perte de confidentialité, permettant aux entreprises d'équilibrer l'utilité des données et la protection individuelle, et doivent être gérés de manière centralisée pour suivre le budget cumulé de confidentialité.

Exemple concret

Un bureau national des statistiques publie des agrégats de recensement avec injection de bruit différentiel en matière de confidentialité. Les chercheurs qui interrogent les chiffres démographiques obtiennent des résultats légèrement perturbés, préservant ainsi les tendances générales tout en empêchant la réidentification des répondants individuels, même lorsqu'ils sont combinés avec d'autres ensembles de données.