Resampling methods for Private Statistical Inference

要約

差分プライバシーを使用して信頼区間を構築するタスクを検討します。
ノンパラメトリック ブートストラップの 2 つのプライベート バリアントを提案します。これは、データのパーティションに対して実行される複数の「小さな」ブートストラップの結果の中央値をプライベートに計算し、結果として得られる信頼区間のカバレッジ誤差に漸近限界を与えます。
固定の差分プライバシー パラメーター $\epsilon$ の場合、私たちの方法は、サンプル サイズ $n$ の対数係数内で非プライベート ブートストラップのエラー率と同じエラー率を享受できます。
実際のデータと合成データの両方を使用して、平均値推定、中央値推定、ロジスティック回帰の方法のパフォーマンスを経験的に検証します。
私たちの方法は、既存の方法(および非プライベートベースライン)と同様のカバレッジ精度を達成しながら、以前のアプローチよりも著しく短い($\gtrsim 10$ 倍)信頼区間を提供します。

要約(オリジナル)

We consider the task of constructing confidence intervals with differential privacy. We propose two private variants of the non-parametric bootstrap, which privately compute the median of the results of multiple ‘little’ bootstraps run on partitions of the data and give asymptotic bounds on the coverage error of the resulting confidence intervals. For a fixed differential privacy parameter $\epsilon$, our methods enjoy the same error rates as that of the non-private bootstrap to within logarithmic factors in the sample size $n$. We empirically validate the performance of our methods for mean estimation, median estimation, and logistic regression with both real and synthetic data. Our methods achieve similar coverage accuracy to existing methods (and non-private baselines) while providing notably shorter ($\gtrsim 10$ times) confidence intervals than previous approaches.

arxiv情報

著者 Karan Chadha,John Duchi,Rohith Kuditipudi
発行日 2024-05-31 17:59:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.LG, stat.ME, stat.ML パーマリンク