A Trajectory K-Anonymity Model Based on Point Density and Partition

要約

人々の日常生活がさまざまなモバイル電子機器とますます切り離せないものになるにつれ、関連するサービス アプリケーション プラットフォームやネットワーク オペレーターは、多数の個人情報を簡単に収集できるようになります。
これらのデータを科学研究や商業目的で公開する場合、特に時空間軌跡データセットの公開では、ユーザーのプライバシーが危険にさらされます。
したがって、ユーザーのプライバシーの漏洩を避けるために、データを公開する前にデータを匿名化する必要があります。
ただし、一部の攻撃者は他のデータベースとの接続によってユーザーの身元を推測する可能性があるため、軌跡のプライバシーを保護するには、個人の一意の識別子を単に削除するだけでは不十分です。
再識別を避けるために複数の軌跡を結合することに多くの作業が費やされてきましたが、これらのソリューションでは、匿名性要件を達成するために常にデータ品質を犠牲にする必要があります。
ユーザーの軌跡データセットに十分なプライバシー保護を提供するために、この論文では、再識別攻撃に対する軌跡プライバシーに関する研究を開発し、点密度と分割 (KPDP) に基づく軌跡 K 匿名性モデルを提案します。
私たちのアプローチは、軌道セットパーティションの前処理と軌道クラスタリングアルゴリズムに関する既存の軌道一般化匿名化技術を改善します。
再識別攻撃にうまく抵抗し、k-匿名化データセットのデータユーティリティの損失を軽減します。
実世界のデータセットでの一連の実験により、提案されたモデルには、他の既存の手法と比べて、データの有用性が高く、アルゴリズムの実行時間が短いという点で大きな利点があることが示されています。

要約(オリジナル)

As people’s daily life becomes increasingly inseparable from various mobile electronic devices, relevant service application platforms and network operators can collect numerous individual information easily. When releasing these data for scientific research or commercial purposes, users’ privacy will be in danger, especially in the publication of spatiotemporal trajectory datasets. Therefore, to avoid the leakage of users’ privacy, it is necessary to anonymize the data before they are released. However, more than simply removing the unique identifiers of individuals is needed to protect the trajectory privacy, because some attackers may infer the identity of users by the connection with other databases. Much work has been devoted to merging multiple trajectories to avoid re-identification, but these solutions always require sacrificing data quality to achieve the anonymity requirement. In order to provide sufficient privacy protection for users’ trajectory datasets, this paper develops a study on trajectory privacy against re-identification attacks, proposing a trajectory K-anonymity model based on Point Density and Partition (KPDP). Our approach improves the existing trajectory generalization anonymization techniques regarding trajectory set partition preprocessing and trajectory clustering algorithms. It successfully resists re-identification attacks and reduces the data utility loss of the k-anonymized dataset. A series of experiments on a real-world dataset show that the proposed model has significant advantages in terms of higher data utility and shorter algorithm execution time than other existing techniques.

arxiv情報

著者 Wanshu Yu,Haonan Shi,Hongyun Xu
発行日 2023-07-31 17:10:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG パーマリンク