Differentially Private Topological Data Analysis


本論文は、最適に近い私的パーシステンスダイアグラムを生成する、差分的私的(DP)トポロジカルデータ解析(TDA)を初めて試みたものである。永続性ダイアグラムの感度をボトルネック距離の観点から分析し、一般的に用いられる♪v{C}ech complexはサンプルサイズ$n$が大きくなっても感度が低下しないことを示す。また、一般的によく使われる♪v{C}ech complexは、サンプルサイズ$n$が大きくなっても感度が下がらないことを示す。このことは、♪v{C}ech complexの永続性図を私有化することを困難にする。代替案として、$L^1$-distance to measure (DTM)によって得られるパーシステンスダイアグラムの感度が$O(1/n)$であることを示す。感度分析に基づき、$L^1$-DTMの永続性ダイアグラムのボトルネック距離で効用関数を定義した指数メカニズムを用いることを提案する。また、本プライバシー機構の精度の上界と下界を導出する。得られた下界は、本機構のプライバシー誤差がほぼ最適であることを示す。得られた境界は、我々の機構のプライバシー誤差がほぼ最適であることを示している。我々は、シミュレーションと、人間の動きを追跡する実際のデータセット上で、私有化されたパーシステンスダイアグラムの性能を実証する。


This paper is the first to attempt differentially private (DP) topological data analysis (TDA), producing near-optimal private persistence diagrams. We analyze the sensitivity of persistence diagrams in terms of the bottleneck distance, and we show that the commonly used \v{C}ech complex has sensitivity that does not decrease as the sample size $n$ increases. This makes it challenging for the persistence diagrams of \v{C}ech complexes to be privatized. As an alternative, we show that the persistence diagram obtained by the $L^1$-distance to measure (DTM) has sensitivity $O(1/n)$. Based on the sensitivity analysis, we propose using the exponential mechanism whose utility function is defined in terms of the bottleneck distance of the $L^1$-DTM persistence diagrams. We also derive upper and lower bounds of the accuracy of our privacy mechanism; the obtained bounds indicate that the privacy error of our mechanism is near-optimal. We demonstrate the performance of our privatized persistence diagrams through simulations as well as on a real dataset tracking human movement.


著者 Taegyu Kang,Sehwan Kim,Jinwon Sohn,Jordan Awan
発行日 2023-11-03 16:55:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CG, cs.CR, cs.LG, math.AT, stat.ML パーマリンク