Summary Statistic Privacy in Data Sharing

要約

異なる当事者間でのデータ共有は、産業界や学術界でますます一般的になってきています。データ共有の場面で発生するプライバシーに関する重要な問題は、データの根本的な分布に関するものである。例えば、ネットワーク企業のデータの総トラフィック量は、そのビジネスの規模を明らかにすることができ、これは企業秘密とみなされる可能性があります。残念ながら、既存のプライバシーフレームワーク(例:差分プライバシー、匿名化)では、このような懸念に十分に対応できていない。本論文では、このような要約統計プライバシーの懸念を分析し保護するためのフレームワークである要約統計プライバシーを提案する。様々なデータ分布や統計的秘密に合わせることができる量子化メカニズムのクラスを提案し、我々のフレームワークの下でそれらのプライバシーと歪みのトレードオフを分析する。プライバシーとユーティリティのトレードオフに対応する下界を証明し、これはある体制下での量子化メカニズムのトレードオフと、小さな定数係数まで一致する。最後に、提案する量子化機構が、実世界のデータセットにおいて、代替のプライバシー機構よりも優れたプライバシー-歪みトレードオフを達成することを実証する。

要約(オリジナル)

Data sharing between different parties has become increasingly common across industry and academia. An important class of privacy concerns that arises in data sharing scenarios regards the underlying distribution of data. For example, the total traffic volume of data from a networking company can reveal the scale of its business, which may be considered a trade secret. Unfortunately, existing privacy frameworks (e.g., differential privacy, anonymization) do not adequately address such concerns. In this paper, we propose summary statistic privacy, a framework for analyzing and protecting these summary statistic privacy concerns. We propose a class of quantization mechanisms that can be tailored to various data distributions and statistical secrets, and analyze their privacy-distortion trade-offs under our framework. We prove corresponding lower bounds on the privacy-utility tradeoff, which match the tradeoffs of the quantization mechanism under certain regimes, up to small constant factors. Finally, we demonstrate that the proposed quantization mechanisms achieve better privacy-distortion tradeoffs than alternative privacy mechanisms on real-world datasets.

arxiv情報

著者 Zinan Lin,Shuaiqi Wang,Vyas Sekar,Giulia Fanti
発行日 2023-03-03 15:29:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CR, cs.LG パーマリンク