要約
\{0,1\}^n$ のビット文字列 $A_1,\ldots,A_m\ のデータベースが与えられた場合、基本的なデータ構造タスクは、指定されたクエリ $B\in \{0,1\ 間の距離を推定することです。
}^n$ をデータベース内のすべての文字列に置き換えます。
さらに、これらの距離統計を安全な方法で公開することでデータベースの整合性を確保したい場合もあります。
この研究では、ハミングと編集距離に焦点を当てて、このタイプのタスク用の差分プライベート (DP) データ構造を提案します。
強力なプライバシー保証に加えて、当社のデータ構造は時間とスペースの効率も優れています。
特に、私たちのデータ構造は、任意の長さのクエリのシーケンスに対して $\epsilon$-DP であり、データベース内の文字列までの最大距離が最大 $k$ であるようなクエリ $B$ に対しては、$ を出力します。
m$ の距離推定値。
さらに、 – ハミング距離の場合、データ構造は $\widetilde O(mk+n)$ 時間であらゆるクエリに応答し、各推定値は最大 $\widetilde O(k/e^{\epsilon/\) だけ真の距離から外れます。
ログ k})$;
– 編集距離の場合、データ構造は $\widetilde O(mk^2+n)$ 時間以内にあらゆるクエリに応答し、各推定値は実際の距離から最大で $\widetilde O(k/e^{\epsilon/(
\log k \log n)})$。
中程度の $k$ の場合、両方のデータ構造がサブリニア クエリ操作をサポートします。
これらの結果は、ランダム化応答技術をビット反転手順として新たに適応させ、スケッチした文字列に適用することで得られます。
要約(オリジナル)
Given a database of bit strings $A_1,\ldots,A_m\in \{0,1\}^n$, a fundamental data structure task is to estimate the distances between a given query $B\in \{0,1\}^n$ with all the strings in the database. In addition, one might further want to ensure the integrity of the database by releasing these distance statistics in a secure manner. In this work, we propose differentially private (DP) data structures for this type of tasks, with a focus on Hamming and edit distance. On top of the strong privacy guarantees, our data structures are also time- and space-efficient. In particular, our data structure is $\epsilon$-DP against any sequence of queries of arbitrary length, and for any query $B$ such that the maximum distance to any string in the database is at most $k$, we output $m$ distance estimates. Moreover, – For Hamming distance, our data structure answers any query in $\widetilde O(mk+n)$ time and each estimate deviates from the true distance by at most $\widetilde O(k/e^{\epsilon/\log k})$; – For edit distance, our data structure answers any query in $\widetilde O(mk^2+n)$ time and each estimate deviates from the true distance by at most $\widetilde O(k/e^{\epsilon/(\log k \log n)})$. For moderate $k$, both data structures support sublinear query operations. We obtain these results via a novel adaptation of the randomized response technique as a bit flipping procedure, applied to the sketched strings.
arxiv情報
| 著者 | Jerry Yao-Chieh Hu,Erzhi Liu,Han Liu,Zhao Song,Lichen Zhang |
| 発行日 | 2024-11-08 18:10:07+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google