Sharper Bounds for Chebyshev Moment Matching with Applications to Differential Privacy and Beyond


主なアプリケーションとして、私たちの結果は、$n$ ポイントのデータセットに基づいて、Wasserstein-1 エラー $\tilde{O}(1/n)$ を持つ差分プライベート合成データ分布を構築するための単純な「線形クエリ」アルゴリズムを生成します。
この限界は対数因子まで最適であり、Boedihardjo、Strohmer、Vershynin の最近の進歩と一致します [Probab.
Rel., 2024] では、より複雑な「超規則ランダム ウォーク」手法を使用して、以前のアプローチに固有の $O(1/\sqrt{n})$ の精度の壁を打ち破っています。
数値線形代数における新しいモーメントベースの回復限界の 2 番目の応用例を示します。Braverman、Krishnan、および Musco [STOC 2022] のアプローチを改善することで、私たちの結果は、対称行列のスペクトル密度を推定するためのより高速なアルゴリズムを生み出します。


We study the problem of approximately recovering a probability distribution given noisy measurements of its Chebyshev polynomial moments. We sharpen prior work, proving that accurate recovery in the Wasserstein distance is possible with more noise than previously known. As a main application, our result yields a simple ‘linear query’ algorithm for constructing a differentially private synthetic data distribution with Wasserstein-1 error $\tilde{O}(1/n)$ based on a dataset of $n$ points in $[-1,1]$. This bound is optimal up to log factors and matches a recent breakthrough of Boedihardjo, Strohmer, and Vershynin [Probab. Theory. Rel., 2024], which uses a more complex ‘superregular random walk’ method to beat an $O(1/\sqrt{n})$ accuracy barrier inherent to earlier approaches. We illustrate a second application of our new moment-based recovery bound in numerical linear algebra: by improving an approach of Braverman, Krishnan, and Musco [STOC 2022], our result yields a faster algorithm for estimating the spectral density of a symmetric matrix up to small error in the Wasserstein distance.


著者 Cameron Musco,Christopher Musco,Lucas Rosenblatt,Apoorv Vikram Singh
発行日 2024-08-22 13:26:41+00:00
arxiv_id(pdf)

カテゴリー: cs.DS, cs.LG