How Does Selection Leak Privacy: Revisiting Private Selection and Improved Results for Hyper-parameter Tuning


私たちは、ハイパーパラメータ調整における差分プライバシー (DP) の保証の問題を研究します。これは、いくつかの実行から最適な実行を選択することを含む機械学習の重要なプロセスです。
普及している DP-SGD を含む多くのプライベート アルゴリズムとは異なり、チューニングによるプライバシーへの影響は依然として十分に理解されていません。
最近の研究では、チューニング プロセスのための一般的なプライベート ソリューションが提案されていますが、根本的な疑問が依然として残ります。つまり、このソリューションに対する現在のプライバシーの制限は厳しいのでしょうか?
これは、チューニング プロセスにプライバシー監査を適用することで初めて実証されます。
私たちのその後の研究では、その独特の特性により、プライベート ハイパーパラメータ調整のプライバシーに関する改善された結果が得られました。


We study the problem of guaranteeing Differential Privacy (DP) in hyper-parameter tuning, a crucial process in machine learning involving the selection of the best run from several. Unlike many private algorithms, including the prevalent DP-SGD, the privacy implications of tuning remain insufficiently understood. Recent works propose a generic private solution for the tuning process, yet a fundamental question still persists: is the current privacy bound for this solution tight? This paper contributes both positive and negative answers to this question. Initially, we provide studies affirming the current privacy analysis is indeed tight in a general sense. However, when we specifically study the hyper-parameter tuning problem, such tightness no longer holds. This is first demonstrated by applying privacy audit on the tuning process. Our findings underscore a substantial gap between the current theoretical privacy bound and the empirical bound derived even under the strongest audit setup. The gap found is not a fluke. Our subsequent study provides an improved privacy result for private hyper-parameter tuning due to its distinct properties. Our privacy results are also more generalizable compared to prior analyses that are only easily applicable in specific setups.


著者 Zihang Xiang,Chenglong Wang,Di Wang
発行日 2024-02-20 15:29:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CR, cs.LG パーマリンク