非識別

プライバシーを保護するために、データセットから個人識別情報を削除または不明瞭にして個人を特定しにくくするプロセス。

Definition

技法には、仮名化 (識別子をキーに置き換える)、k-匿名性 (レコードが属性値を共有するようにする)、一般化 (データの粒度を広げる)、抑制 (機密フィールドを省略) などがあります。効果的に匿名化を行うには、プライバシーとデータの有用性のバランスを取る必要があるため、進化する再識別技術の下での再識別リスク評価が必要になります。

Real-World Example

ある都市では、ユーザー ID をランダムなトークンに置き換え、位置を 1 km のグリッドに集約することで、匿名化された交通ログを公開しています。定期的な再識別テストにより、個人の旅行を追跡できないことが確認され、乗客のプライバシーを侵害することなくオープンデータを使用できるようになりました。