Faster Private Minimum Spanning Trees

要約

クラスタリングと合成データ生成のアプリケーションを動機として、$n$ 個の頂点と $ を持つグラフ トポロジ $G=(V,E)$ のエッジ重み差分プライバシー制約の下で最小スパニング ツリー (MST) を解放する問題を検討します。
m$ エッジはパブリックであり、重み行列 $\vec{W}\in \mathbb{R}^{n \times n}$ はプライベートであり、$\rho$-zero-concentrated で近似 MST をリリースしたいと考えています。
差分プライバシー。
重み行列は、各エントリ内で最大 $\Delta_\infty$ の差がある場合に隣接していると見なされます。つまり、$\ell_\infty$ の隣接関係が考慮されます。
既存のプライベート MST アルゴリズムは、$\vec{W}$ の各エントリにノイズを追加して後処理によって MST を推定するか、特定の MST アルゴリズムの実行中にその場で重みにノイズを追加します。
効率的な MST アルゴリズムで後処理アプローチを使用すると、密なグラフでは $O(n^2)$ 時間がかかりますが、MST の重みに $O(n^2\log n)$ の大きさの加算誤差が発生します。
インプレース アルゴリズムは漸近的に有用性が高くなりますが、既存のインプレース アルゴリズムの実行時間は、密なグラフの場合 $O(n^3)$ です。
私たちの主な結果は、固定プライバシー パラメーター $\rho$ に対して $O(m + n^{3/2}\log n)$ で実行しながら、既存のインプレース メソッドの有用性と一致する、新しい差分プライベート MST アルゴリズムです。
私たちのアルゴリズムの技術的核心は、Report-Noisy-Max の効率的なサブリニア時間シミュレーションであり、すべてのエッジの重みを $\Delta_\infty$ の倍数に離散化し、同じ重みを持つエッジのグループを形成することで機能します。
具体的には、$O(\sqrt{n} \log n)$ 時間以内に最大 $O(n^2)$ 個のカット エッジの中からノイズの多い最小重みエッジをサンプリングできるデータ構造を提示します。
実験による評価は、私たちのアルゴリズムが実用性または実行時間のいずれかにおいて以前のアルゴリズムを大幅に改善するという私たちの主張を裏付けています。

要約(オリジナル)

Motivated by applications in clustering and synthetic data generation, we consider the problem of releasing a minimum spanning tree (MST) under edge-weight differential privacy constraints where a graph topology $G=(V,E)$ with $n$ vertices and $m$ edges is public, the weight matrix $\vec{W}\in \mathbb{R}^{n \times n}$ is private, and we wish to release an approximate MST under $\rho$-zero-concentrated differential privacy. Weight matrices are considered neighboring if they differ by at most $\Delta_\infty$ in each entry, i.e., we consider an $\ell_\infty$ neighboring relationship. Existing private MST algorithms either add noise to each entry in $\vec{W}$ and estimate the MST by post-processing or add noise to weights in-place during the execution of a specific MST algorithm. Using the post-processing approach with an efficient MST algorithm takes $O(n^2)$ time on dense graphs but results in an additive error on the weight of the MST of magnitude $O(n^2\log n)$. In-place algorithms give asymptotically better utility, but the running time of existing in-place algorithms is $O(n^3)$ for dense graphs. Our main result is a new differentially private MST algorithm that matches the utility of existing in-place methods while running in time $O(m + n^{3/2}\log n)$ for fixed privacy parameter $\rho$. The technical core of our algorithm is an efficient sublinear time simulation of Report-Noisy-Max that works by discretizing all edge weights to a multiple of $\Delta_\infty$ and forming groups of edges with identical weights. Specifically, we present a data structure that allows us to sample a noisy minimum weight edge among at most $O(n^2)$ cut edges in $O(\sqrt{n} \log n)$ time. Experimental evaluations support our claims that our algorithm significantly improves previous algorithms either in utility or running time.

arxiv情報

著者 Rasmus Pagh,Lukas Retschmeier
発行日 2024-08-13 16:00:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.DS, cs.LG パーマリンク