Privacy amplification by random allocation


ユーザーのデータが$ k $ステップでランダムに均一に選択されるアルゴリズムのプライバシー保証を検討し、$ t $差までのプライベートステップのシーケンス(またはセット)から均一に選択します。
このサンプリングスキームのプライバシー保証は、各ステップがユーザーのデータを確率$(1+ O(1))k/t $で使用する適切に研究された独立(またはポアソン)サブサンプリングのプライバシー保証によって上限になる可能性があることを実証します。
$ k = 1 $の場合は、BalleらのDP-SGDのコンテキストで以前に研究されています。
(2020)そしてごく最近、Chua et al。
Choquette-Choo et al。
Choquette-Choo et al。


We consider the privacy guarantees of an algorithm in which a user’s data is used in $k$ steps randomly and uniformly chosen from a sequence (or set) of $t$ differentially private steps. We demonstrate that the privacy guarantees of this sampling scheme can be upper bound by the privacy guarantees of the well-studied independent (or Poisson) subsampling in which each step uses the user’s data with probability $(1+ o(1))k/t $. Further, we provide two additional analysis techniques that lead to numerical improvements in some parameter regimes. The case of $k=1$ has been previously studied in the context of DP-SGD in Balle et al. (2020) and very recently in Chua et al. (2024); Choquette-Choo et al. (2024). Privacy analysis of Balle et al. (2020) relies on privacy amplification by shuffling which leads to overly conservative bounds. Privacy analysis of Chua et al. (2024a); Choquette-Choo et al. (2024) relies on Monte Carlo simulations that are computationally prohibitive in many practical scenarios and have additional inherent limitations.


著者 Vitaly Feldman,Moshe Shenfeld
発行日 2025-03-19 17:33:33+00:00
arxivサイト arxiv_id(pdf)

