要約
チェビシェフ多項式モーメントのノイズの多い測定値を考慮して、確率分布を近似的に復元する問題を研究します。
我々は以前の研究を鮮明にし、以前に知られていたよりも多くのノイズでもワッサーシュタイン距離での正確な復元が可能であることを証明しました。
主なアプリケーションとして、私たちの結果は、$n$ ポイントのデータセットに基づいて、Wasserstein-1 エラー $\tilde{O}(1/n)$ を持つ差分プライベート合成データ分布を構築するための単純な「線形クエリ」アルゴリズムを生成します。
$[-1,1]$。
この限界は対数因子まで最適であり、Boedihardjo、Strohmer、Vershynin の最近の進歩と一致します [Probab.
理論。
Rel., 2024] では、より複雑な「超規則ランダム ウォーク」手法を使用して、以前のアプローチに固有の $O(1/\sqrt{n})$ の精度の壁を打ち破っています。
数値線形代数における新しいモーメントベースの回復限界の 2 番目の応用例を示します。Braverman、Krishnan、および Musco [STOC 2022] のアプローチを改善することで、私たちの結果は、対称行列のスペクトル密度を推定するためのより高速なアルゴリズムを生み出します。
ワッサーシュタイン距離の誤差はわずかです。
要約(オリジナル)
We study the problem of approximately recovering a probability distribution given noisy measurements of its Chebyshev polynomial moments. We sharpen prior work, proving that accurate recovery in the Wasserstein distance is possible with more noise than previously known. As a main application, our result yields a simple ‘linear query’ algorithm for constructing a differentially private synthetic data distribution with Wasserstein-1 error $\tilde{O}(1/n)$ based on a dataset of $n$ points in $[-1,1]$. This bound is optimal up to log factors and matches a recent breakthrough of Boedihardjo, Strohmer, and Vershynin [Probab. Theory. Rel., 2024], which uses a more complex ‘superregular random walk’ method to beat an $O(1/\sqrt{n})$ accuracy barrier inherent to earlier approaches. We illustrate a second application of our new moment-based recovery bound in numerical linear algebra: by improving an approach of Braverman, Krishnan, and Musco [STOC 2022], our result yields a faster algorithm for estimating the spectral density of a symmetric matrix up to small error in the Wasserstein distance.
arxiv情報
著者 | Cameron Musco,Christopher Musco,Lucas Rosenblatt,Apoorv Vikram Singh |
発行日 | 2024-08-22 13:26:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google