Protecting Global Properties of Datasets with Distribution Privacy Mechanisms


タイトル: データセットの分布プライバシー機構によるグローバルプロパティの保護

– 多くのレコードから集約されるデータセットのプロパティの機密性を確保する問題を考慮する。
– このようなプロパティには、貿易秘密や人口統計データなどの機密情報が含まれ、書籍で一般的に議論される個々のレコードのプライバシーとは異なるデータ保護の概念が存在する。
– 本研究では、分布プライバシーフレームワークを使用して、このようなデータの機密性を形式化する方法を示す。
– PufferfishプライバシーのWassersteinメカニズムと属性プライバシーのGaussianメカニズムをこのフレームワークに拡張し、基盤となるデータの仮定と、それらがどのように緩和できるかを分析する。
– その後、これらの機構のプライバシーと有用性のトレードオフを実証的に評価し、グローバルプロパティ攻撃に対して適用する。
– 結果は、当社のメカニズムが攻撃の効果を実際に減少させ、粗強なグループ差分プライバシー基準よりも有用性を大幅に提供できることを示している。
– 本研究は、データセットのグローバルプロパティを保護するための理論的なメカニズムとその実践での評価の基礎を提供する。


We consider the problem of ensuring confidentiality of dataset properties aggregated over many records of a dataset. Such properties can encode sensitive information, such as trade secrets or demographic data, while involving a notion of data protection different to the privacy of individual records typically discussed in the literature. In this work, we demonstrate how a distribution privacy framework can be applied to formalize such data confidentiality. We extend the Wasserstein Mechanism from Pufferfish privacy and the Gaussian Mechanism from attribute privacy to this framework, then analyze their underlying data assumptions and how they can be relaxed. We then empirically evaluate the privacy-utility tradeoffs of these mechanisms and apply them against a practical property inference attack which targets global properties of datasets. The results show that our mechanisms can indeed reduce the effectiveness of the attack while providing utility substantially greater than a crude group differential privacy baseline. Our work thus provides groundwork for theoretical mechanisms for protecting global properties of datasets along with their evaluation in practice.


著者 Michelle Chen,Olga Ohrimenko
発行日 2023-04-10 12:04:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CR, cs.CY, cs.LG パーマリンク