匿名化ソリューションとは? 導入方法、代表的なソリューションを整理する:IT導入完全ガイド(3/3 ページ)
匿名化ソリューションはどう導入するのか、自社の要件でチェックすべきポイントを整理。国内3つの主要匿名化ソリューションの特徴も紹介。
k-匿名化以外の匿名化手法は必要か?
現在、市場に出回っているデータ匿名化ソリューションの多くはk-匿名化の機能を前面に出しているが、必ずしも全てのデータ匿名化のニーズにk-匿名化が合致するわけではない。データの特質や用途、その他の条件によっては、それ以外の匿名化手法が適している場合も多い。
従って、あらかじめ自社におけるデータ匿名化の要件をきちんと洗い出し、どのようなデータ匿名化手法が適しているかをきちんと判断した上で、それを実装しているツールを選びたい。初めから「k-匿名化ありき」で導入計画を進めると、いざ要件を整理した際にツールのスペックとの不整合を起こす可能性もある。
また製品によっては、k-匿名化以外の匿名化手法に対応していないものもあるため、どの製品がどのような匿名化手法をサポートしているのか、あらかじめ調べた上で選定に臨むべきだろう。
表1 匿名加工情報の手法例 出典:総務省「個人情報の保護に関する法律についてのガイドライン(匿名加工情報編)」※匿名加工情報の作成に当たっての一般的な加工手法を例示したものであり、その他の手法を用いて適切に加工することを妨げるものではない。
k-匿名化でも残存するリスクをどう捉えるか?
k-匿名化を使えば、特定のデータがどの個人に属するものなのか、特定しにくくできる。一般的にk-匿名化により匿名化されたデータは、そこからさかのぼって個人を特定できない「不可逆性」の特性を持つとされる。しかし近年の研究では、k-匿名化されたデータであっても特定の条件化では個人の特定が可能であるとの報告もある。
特に、そのデータの匿名化で行った加工処理の内容が漏れた場合には、さかのぼって個人を特定される危険性が高まるとされている。そこで製品によっては、たとえ加工処理のアルゴリズムが漏れたとしても、容易に個人を特定できないよう独自の仕組みを備えたものもある。
また、たとえそのデータ単体では個人を特定できなかったとしても、外部のデータと照合すると個人特定のリスクが高まることもある。そこで、もし匿名化したデータを外部に出した場合に、どの程度のリスクが生じるかを評価してくれるツールがあれば便利だ。本稿執筆時点(2018年1月)ではこうしたツールが製品化されている例は少ないが、今後データ匿名化ソリューションが普及するにつれ、各ベンダーともこうした機能の提供に力を入れるものと予想される。
複数のデータを掛け合わせたときに特定されるリスクも評価しておく必要がある。
(例)匿名化された情報であっても、属性情報(年齢、身長)と照合することで、個人が特定されてしまう。
Copyright © ITmedia, Inc. All Rights Reserved.