More Data Types More Problems: A Temporal Analysis of Complexity, Stability, and Sensitivity in Privacy Policies


データ主体に関する個人を特定できる情報 (PII) の収集は、大きなビジネスになっています。
データ ブローカーとデータ プロセッサは、消費者データの収集、購入、販売から利益を得る数十億ドル規模の業界の一部です。
この調査では、データ ブローカーとデータ プロセッサのデータ収集活動を調査するために、1997 年から 2019 年までのプライバシー ポリシーの大規模なテキスト データセットを調べます。
また、立法テキストからキュレーションされた PII データ タイプを表す PII 関連用語のオリジナル辞書も開発しています。
このメソスケールの分析では、長期にわたってプライバシー ポリシーの安定性、複雑さ、機密性を理解するために、単語、トピック、およびネットワーク レベルでプライバシー ポリシーを調べます。
(1) プライバシー法は、プライバシー ポリシーにおける PII データ タイプの安定性と混乱の変化と相関していることがわかりました。
(2) プライバシー ポリシーの複雑さは時間の経過とともに減少し、より規則的になります。
(3) 感度は時間の経過とともに上昇し、新しいプライバシー法が導入されたときのイベントと相関するスパイクを示します。


Collecting personally identifiable information (PII) on data subjects has become big business. Data brokers and data processors are part of a multi-billion-dollar industry that profits from collecting, buying, and selling consumer data. Yet there is little transparency in the data collection industry which makes it difficult to understand what types of data are being collected, used, and sold, and thus the risk to individual data subjects. In this study, we examine a large textual dataset of privacy policies from 1997-2019 in order to investigate the data collection activities of data brokers and data processors. We also develop an original lexicon of PII-related terms representing PII data types curated from legislative texts. This mesoscale analysis looks at privacy policies overtime on the word, topic, and network levels to understand the stability, complexity, and sensitivity of privacy policies over time. We find that (1) privacy legislation correlates with changes in stability and turbulence of PII data types in privacy policies; (2) the complexity of privacy policies decreases over time and becomes more regularized; (3) sensitivity rises over time and shows spikes that are correlated with events when new privacy legislation is introduced.


著者 Juniper Lovato,Philip Mueller,Parisa Suchdev,Peter S. Dodds
発行日 2023-02-17 15:21:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL, cs.SI パーマリンク