Differentially Private Bootstrap: New Privacy Analysis and Inference Strategies




– DP(差分プライバシー)メカニズムは、統計分析手順にランダム性を導入することによって、個人レベルの情報を保護する方法です。
– 数多くのDPツールが利用可能ではあるものの、DPの下で統計的推論を実施するための一般技術には不足があります。
– 私たちは、複数のプライベートブートストラップ推定値をリリースし、サンプリング分布を推定し、信頼区間を構築するDPブートストラップ手順を調査します。
– 私たちのプライバシー分析は、任意のDPメカニズムに適用可能な、単一のDPブートストラップ推定のプライバシーコストに関する新しい結果を示し、既存の文献でのブートストラップの誤った適用を特定します。
– 我々は、Gaussian-DP(GDP)フレームワーク(Dong et al.、2022)を使用して、$B$個のDPブートストラップ推定値をリリースするメカニズムが、$(\mu/\sqrt{(2-2/\mathrm{e})B})$-GDPを満たす場合、$B$が無限に近づくにつれて、$\mu$ -GDPを漸近的に満たすことを示します。
– さらに、DPブートストラップ推定値を分布の推定に使用する逆畳み込みを使用して、サンプリング分布を正確に推定します。これはDPにおいて画期的です。
– 私たちは、集団平均推定、ロジスティック回帰、およびパーセンタイル回帰のようなタスクのために私たちの密度推定から信頼区間を導出し、シミュレーションと2016年カナダ国勢調査データを用いた実験において既存方法と比較します。
– 私たちのプライベート信頼区間は名目上のカバレージレベルを達成し、パーセンタイル回帰のためのプライベート推論の初めてのアプローチを提供します。


Differentially private (DP) mechanisms protect individual-level information by introducing randomness into the statistical analysis procedure. Despite the availability of numerous DP tools, there remains a lack of general techniques for conducting statistical inference under DP. We examine a DP bootstrap procedure that releases multiple private bootstrap estimates to infer the sampling distribution and construct confidence intervals (CIs). Our privacy analysis presents new results on the privacy cost of a single DP bootstrap estimate, applicable to any DP mechanisms, and identifies some misapplications of the bootstrap in the existing literature. Using the Gaussian-DP (GDP) framework (Dong et al.,2022), we show that the release of $B$ DP bootstrap estimates from mechanisms satisfying $(\mu/\sqrt{(2-2/\mathrm{e})B})$-GDP asymptotically satisfies $\mu$-GDP as $B$ goes to infinity. Moreover, we use deconvolution with the DP bootstrap estimates to accurately infer the sampling distribution, which is novel in DP. We derive CIs from our density estimate for tasks such as population mean estimation, logistic regression, and quantile regression, and we compare them to existing methods using simulations and real-world experiments on 2016 Canada Census data. Our private CIs achieve the nominal coverage level and offer the first approach to private inference for quantile regression.


著者 Zhanyu Wang,Guang Cheng,Jordan Awan
発行日 2023-04-21 13:12:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CR, cs.DS, cs.LG, stat.ML パーマリンク