Differential Privacy for Clustering Under Continual Observation


点の挿入と削除の両方が行われる $\mathbb{R}^d$ 内のデータセットをプライベートにクラスタリングする問題を考えます。
具体的には、継続的観察の下で $k$-mean 目的のための $\varepsilon$-差分プライベート クラスタリング メカニズムを提供します。
これは、更新回数 $T$ に対数的にのみ依存する加算誤差を伴う問題に対する最初の近似アルゴリズムです。
そのために、継続的な観察の下で次元削減を実行し、それを $k$-means の差分プライベート貪欲近似アルゴリズムと組み合わせる方法を示します。
また、結果を部分的に $k$-median 問題に拡張します。


We consider the problem of clustering privately a dataset in $\mathbb{R}^d$ that undergoes both insertion and deletion of points. Specifically, we give an $\varepsilon$-differentially private clustering mechanism for the $k$-means objective under continual observation. This is the first approximation algorithm for that problem with an additive error that depends only logarithmically in the number $T$ of updates. The multiplicative error is almost the same as non privately. To do so we show how to perform dimension reduction under continual observation and combine it with a differentially private greedy approximation algorithm for $k$-means. We also partially extend our results to the $k$-median problem.


著者 Max Dupré la Tour,Monika Henzinger,David Saulpic
発行日 2023-07-27 14:36:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.DS, cs.LG パーマリンク