個人情報の利活用の場面において個人情報の匿名化を避けて通ることはできないわけですが、踏み込んだ知識はデータ処理の門外漢には敷居が高く、「完璧な匿名化手法は存在しない」というかの有名な結論については理解できても、そこから進んで「どうするのがベターな匿名化手法なのか」といったことについては今ひとつ理解できずにいました。 そんな中でデータ匿名化手法 ―ヘルスデータ事例に学ぶ個人情報保護の存在を知り、早速読んでみたところ、いくつか腑に落ちたことがあったのでまとめてみます。 匿名化は確率的なものなので、再特定化される可能性をゼロにはできない。(上記の「完璧な匿名化手法は存在しない」と同じこと) 生データを提供することで得られるメリットは、生データを提供することで発生するリスクとのトレードオフ。 問題はリスクがゼロかではなく、リスクを正当化できるか。 データの開示方法、データの開示を受ける人が既に保有
