Where you go is who you are — A study on machine learning based semantic privacy attacks

要約

デジタル アプリケーションの使用量の増加と、ユーザー データの販売を含むその基盤となるビジネス モデルを考慮すると、データ プライバシーに関する懸念はどこにでもあります。
位置データは、近くの興味のある地点 (POI) に基づいて訪問場所を分類するなど、ユーザーの活動パターンや興味を推測できるため、特に機密性が高くなります。
さらに、機械学習手法は、ビッグデータを解釈するための新しい強力なツールを提供します。
これらの考慮事項を踏まえて、私たちは次の疑問を提起します。現実的な機械学習ベースのプライバシー攻撃が、データの不正確性を条件として生の位置データから意味のある意味情報を取得する可能性がある実際のリスクは何ですか?
これに応えて、場所の分類とユーザー プロファイリングという 2 つの攻撃シナリオの系統的な分析を示します。
Foursquare データセットと追跡データに関する実験では、高品質の空間情報が悪用される可能性があり、位置精度が最大 200m であっても重大なプライバシーの損失につながる可能性があることが実証されています。
1 km を超える位置難読化では、空間情報はほとんど価値を付加しませんが、時間情報のみによる高いプライバシー リスクが残ります。
POI などの公開コンテキスト データの利用可能性は、空間情報に基づく推論において重要な役割を果たします。
私たちの調査結果は、政策立案者がプライバシー規制に関して考慮すべきであり、個人の位置情報保護対策の指針となる可能性がある、追跡データと空間コンテキスト データの増え続けるデータベースのリスクを指摘しています。

要約(オリジナル)

Concerns about data privacy are omnipresent, given the increasing usage of digital applications and their underlying business model that includes selling user data. Location data is particularly sensitive since they allow us to infer activity patterns and interests of users, e.g., by categorizing visited locations based on nearby points of interest (POI). On top of that, machine learning methods provide new powerful tools to interpret big data. In light of these considerations, we raise the following question: What is the actual risk that realistic, machine learning based privacy attacks can obtain meaningful semantic information from raw location data, subject to inaccuracies in the data? In response, we present a systematic analysis of two attack scenarios, namely location categorization and user profiling. Experiments on the Foursquare dataset and tracking data demonstrate the potential for abuse of high-quality spatial information, leading to a significant privacy loss even with location inaccuracy of up to 200m. With location obfuscation of more than 1 km, spatial information hardly adds any value, but a high privacy risk solely from temporal information remains. The availability of public context data such as POIs plays a key role in inference based on spatial information. Our findings point out the risks of ever-growing databases of tracking data and spatial context data, which policymakers should consider for privacy regulations, and which could guide individuals in their personal location protection measures.

arxiv情報

著者 Nina Wiedemann,Ourania Kounadi,Martin Raubal,Krzysztof Janowicz
発行日 2023-10-26 17:56:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CE, cs.CY, cs.LG パーマリンク