Enhancing Scalability of Metric Differential Privacy via Secret Dataset Partitioning and Benders Decomposition

要約

メトリック ディファレンシャル プライバシー (mDP) は、ディファレンシャル プライバシー (DP) の概念を拡張し、データ摂動の新しいパラダイムとして機能します。
これは、単語埋め込みとしてエンコードされたテキスト データや、道路網やグリッド マップ上の地理的位置データなど、一般的な計量空間で表現される秘密データを保護するように設計されています。
mDP で最適なデータ摂動メカニズムを導出するには、線形計画法 (LP) が広く使用されていますが、決定変数の多項式爆発の影響を受ける可能性があり、大規模な mDP では実用的ではありません。
このペーパーでは、私たちの目的は、LP ベースの mDP のスケーラビリティを強化するための新しい計算フレームワークを開発することです。
シークレット レコード間の mDP 制約によって確立された接続を考慮して、元のシークレット データセットをさまざまなサブセットに分割します。
パーティションに基づいて、mDP の LP 問題を再定式化し、ベンダー分解によってそれを解決します。これは 2 つの段階で構成されます: (1) サブセット全体にわたる摂動計算を管理するマスター プログラム、および (2) それぞれを管理する一連のサブ問題
サブセット内の摂動の導出。
道路網/グリッドマップの地理位置データ、テキストデータ、合成データを含む複数のデータセットに対する実験結果は、提案したメカニズムの優れたスケーラビリティと効率を強調しています。

要約(オリジナル)

Metric Differential Privacy (mDP) extends the concept of Differential Privacy (DP) to serve as a new paradigm of data perturbation. It is designed to protect secret data represented in general metric space, such as text data encoded as word embeddings or geo-location data on the road network or grid maps. To derive an optimal data perturbation mechanism under mDP, a widely used method is linear programming (LP), which, however, might suffer from a polynomial explosion of decision variables, rendering it impractical in large-scale mDP. In this paper, our objective is to develop a new computation framework to enhance the scalability of the LP-based mDP. Considering the connections established by the mDP constraints among the secret records, we partition the original secret dataset into various subsets. Building upon the partition, we reformulate the LP problem for mDP and solve it via Benders Decomposition, which is composed of two stages: (1) a master program to manage the perturbation calculation across subsets and (2) a set of subproblems, each managing the perturbation derivation within a subset. Our experimental results on multiple datasets, including geo-location data in the road network/grid maps, text data, and synthetic data, underscore our proposed mechanism’s superior scalability and efficiency.

arxiv情報

著者 Chenxi Qiu
発行日 2024-05-07 14:19:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR パーマリンク