Near-optimal algorithms for private estimation and sequential testing of collision probability

要約

多くの科学分野で広く使用されている離散分布の拡散の基本的な尺度である、\ emphing {衝突確率}を推定およびテストするための新しいアルゴリズムを提示します。
$(\ alpha、\ beta)$を満たすアルゴリズムについて説明します。$ \ tilde {o} \ left(\ log(1/\ beta)} {\ alpha^2 \ 2 \ epsilon^2} \ pha^2 \ 2 \ 2 \ pha^2 \ pha^frac {\ log(1/\ beta)}を使用して、$ \ tilde {o}を使用して$ \ epsilon $を最大で$ \ epsilon $で推定する衝突確率を推定するアルゴリズムについて説明します。
\ le 1 $。これは、以前の作業で$ \ frac {1} {\ alpha^2} $の係数で改善します。
また、衝突確率のためのシーケンシャルテストアルゴリズムも提示します。これは、$ \ tilde {o}(\ frac {1} {\ epsilon^2})$サンプルを使用して$ \ epsilon $で区切られる衝突確率値を区別できます。
私たちのアルゴリズムにはほぼ最適なサンプルの複雑さがあり、実験では、以前の方法よりも大幅に少ないサンプルが必要であることが示されています。

要約(オリジナル)

We present new algorithms for estimating and testing \emph{collision probability}, a fundamental measure of the spread of a discrete distribution that is widely used in many scientific fields. We describe an algorithm that satisfies $(\alpha, \beta)$-local differential privacy and estimates collision probability with error at most $\epsilon$ using $\tilde{O}\left(\frac{\log(1/\beta)}{\alpha^2 \epsilon^2}\right)$ samples for $\alpha \le 1$, which improves over previous work by a factor of $\frac{1}{\alpha^2}$. We also present a sequential testing algorithm for collision probability, which can distinguish between collision probability values that are separated by $\epsilon$ using $\tilde{O}(\frac{1}{\epsilon^2})$ samples, even when $\epsilon$ is unknown. Our algorithms have nearly the optimal sample complexity, and in experiments we show that they require significantly fewer samples than previous methods.

arxiv情報

著者 Robert Busa-Fekete,Umar Syed
発行日 2025-04-18 17:12:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク