Privacy amplification by random allocation

要約

ユーザーのデータが$ k $ステップでランダムに均一に選択されるアルゴリズムのプライバシー保証を検討し、$ t $差までのプライベートステップのシーケンス(またはセット)から均一に選択します。
このサンプリングスキームのプライバシー保証は、各ステップがユーザーのデータを確率$(1+ O(1))k/t $で使用する適切に研究された独立(またはポアソン)サブサンプリングのプライバシー保証によって上限になる可能性があることを実証します。
さらに、いくつかのパラメーターレジームの数値の改善につながる2つの追加分析手法を提供します。
$ k = 1 $の場合は、BalleらのDP-SGDのコンテキストで以前に研究されています。
(2020)そしてごく最近、Chua et al。
(2024);
Choquette-Choo et al。
(2024)。
Balleらのプライバシー分析。
(2020)過度に保守的な境界につながるシャッフルによるプライバシー増幅に依存しています。
チュアらのプライバシー分析。
(2024a);
Choquette-Choo et al。
(2024)多くの実用的なシナリオで計算的に禁止されており、追加の固有の制限があるモンテカルロシミュレーションに依存しています。

要約(オリジナル)

We consider the privacy guarantees of an algorithm in which a user’s data is used in $k$ steps randomly and uniformly chosen from a sequence (or set) of $t$ differentially private steps. We demonstrate that the privacy guarantees of this sampling scheme can be upper bound by the privacy guarantees of the well-studied independent (or Poisson) subsampling in which each step uses the user’s data with probability $(1+ o(1))k/t $. Further, we provide two additional analysis techniques that lead to numerical improvements in some parameter regimes. The case of $k=1$ has been previously studied in the context of DP-SGD in Balle et al. (2020) and very recently in Chua et al. (2024); Choquette-Choo et al. (2024). Privacy analysis of Balle et al. (2020) relies on privacy amplification by shuffling which leads to overly conservative bounds. Privacy analysis of Chua et al. (2024a); Choquette-Choo et al. (2024) relies on Monte Carlo simulations that are computationally prohibitive in many practical scenarios and have additional inherent limitations.

arxiv情報

著者 Vitaly Feldman,Moshe Shenfeld
発行日 2025-03-19 17:33:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク