Differentially private multivariate medians

要約

最新のデータ分析には、厳格なプライバシー保証を満たす統計ツールが必要です。
汚染に対する堅牢性が差分プライバシーに関連していることはよく知られています。
この事実にもかかわらず、差分プライベートで堅牢な多変量位置推定に多変量中央値を使用することは体系的に研究されていません。
私たちは、本質的にシャープな差分プライベート多変量深度ベースの中央値に対する新しい有限サンプルのパフォーマンス保証を開発します。
私たちの結果は、ハーフスペース (またはテューキー) 深度、空間深度、統合デュアル深度など、一般的に使用される深度関数をカバーしています。
コーシー限界の下では、ヘビーテール位置推定のコストがプライバシーのコストを上回ることを示します。
最大 d = 100 の次元でガウス汚染モデルを使用して結果を数値的に実証し、それらを最先端のプライベート平均推定アルゴリズムと比較します。
私たちの調査の副産物として、母集団目的関数の最大化に関する指数関数的メカニズムの出力に対する濃度不平等を証明しました。
この範囲は、穏やかな規則性条件を満たす目的関数に適用されます。

要約(オリジナル)

Statistical tools which satisfy rigorous privacy guarantees are necessary for modern data analysis. It is well-known that robustness against contamination is linked to differential privacy. Despite this fact, using multivariate medians for differentially private and robust multivariate location estimation has not been systematically studied. We develop novel finite-sample performance guarantees for differentially private multivariate depth-based medians, which are essentially sharp. Our results cover commonly used depth functions, such as the halfspace (or Tukey) depth, spatial depth, and the integrated dual depth. We show that under Cauchy marginals, the cost of heavy-tailed location estimation outweighs the cost of privacy. We demonstrate our results numerically using a Gaussian contamination model in dimensions up to d = 100, and compare them to a state-of-the-art private mean estimation algorithm. As a by-product of our investigation, we prove concentration inequalities for the output of the exponential mechanism about the maximizer of the population objective function. This bound applies to objective functions that satisfy a mild regularity condition.

arxiv情報

著者 Kelly Ramsay,Aukosh Jagannath,Shoja’eddin Chenouri
発行日 2024-03-26 16:49:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62G05, 62G35, 62H12, cs.CR, cs.LG, math.ST, stat.ML, stat.TH パーマリンク