要約
個人データのプライバシーを確保しながら最適な統計パフォーマンスを達成することは、現代のデータ分析において挑戦的でありながら重要な目標です。
ただし、プライバシーの制約の下で、最適性、特にミニマックスの下限を特徴付けるのは技術的に困難です。
この問題に対処するために、スコア攻撃と呼ばれる新しいアプローチを提案します。これは、パラメーター推定の差分プライバシー制約付きミニマックス リスクの下限を提供します。
スコア攻撃方法は、差分プライバシーにおける追跡攻撃の概念に基づいており、明確に定義されたスコア統計を持つ任意の統計モデルに適用できます。
さまざまな統計問題の差分プライバシーを確保しながら、未知のモデル パラメーターを推定するミニマックス リスクを対数係数まで最適に下げることができます。
この一般的な方法の有効性と最適性を、古典的な設定と高次元のスパース設定の両方での一般化線形モデル、ペアワイズ比較の Bradley-Terry-Luce モデル、Sobolev クラスのノンパラメトリック回帰など、さまざまな例で示します。
要約(オリジナル)
Achieving optimal statistical performance while ensuring the privacy of personal data is a challenging yet crucial objective in modern data analysis. However, characterizing the optimality, particularly the minimax lower bound, under privacy constraints is technically difficult. To address this issue, we propose a novel approach called the score attack, which provides a lower bound on the differential-privacy-constrained minimax risk of parameter estimation. The score attack method is based on the tracing attack concept in differential privacy and can be applied to any statistical model with a well-defined score statistic. It can optimally lower bound the minimax risk of estimating unknown model parameters, up to a logarithmic factor, while ensuring differential privacy for a range of statistical problems. We demonstrate the effectiveness and optimality of this general method in various examples, such as the generalized linear model in both classical and high-dimensional sparse settings, the Bradley-Terry-Luce model for pairwise comparisons, and nonparametric regression over the Sobolev class.
arxiv情報
著者 | T. Tony Cai,Yichen Wang,Linjun Zhang |
発行日 | 2023-03-13 14:26:27+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google