Differentially Private Topological Data Analysis

要約

【タイトル】差分プライバシーを導入した位相解析データの調査

【要約】

– 本論文は、初めて差分プライバシー(DP)を利用して位相解析データ(TDA)を調査し、ほぼ最適なプライバシー保護の永続図を生成することを試みた。
– ボトルネック距離に関する永続図の感度を分析し、一般的に使用されるチェック複合体は、サンプルサイズ$n$が増加するにつれて減少しない感度を持つことを示した。これは、チェック複合体の永続図をプライバシー保護するのが困難であることを意味する。
– 代替として、$L^1$距離を用いた永続図を導出し、その感度が$O(1 / n)$であることを示した。
– 感度分析に基づき、$L^1$-DTM永続図のボトルネック距離に関するユーティリティ関数を定義した指数メカニズムの使用を提案する。
– 私たちのプライバシーメカニズムの精度の上限と下限を導出し、その精度はほぼ最適であることを示した。
– 人間の動きを追跡する実際のデータセットを含め、シミュレーションで私たちのプライバシー保護された永続図のパフォーマンスを示した。

要約(オリジナル)

This paper is the first to attempt differentially private (DP) topological data analysis (TDA), producing near-optimal private persistence diagrams. We analyze the sensitivity of persistence diagrams in terms of the bottleneck distance, and we show that the commonly used \v{C}ech complex has sensitivity that does not decrease as the sample size $n$ increases. This makes it challenging for the persistence diagrams of \v{C}ech complexes to be privatized. As an alternative, we show that the persistence diagram obtained by the $L^1$-distance to measure (DTM) has sensitivity $O(1/n)$. Based on the sensitivity analysis, we propose using the exponential mechanism whose utility function is defined in terms of the bottleneck distance of the $L^1$-DTM persistence diagrams. We also derive upper and lower bounds of the accuracy of our privacy mechanism; the obtained bounds indicate that the privacy error of our mechanism is near-optimal. We demonstrate the performance of our privatized persistence diagrams through simulations as well as on a real dataset tracking human movement.

arxiv情報

著者 Taegyu Kang,Sehwan Kim,Jinwon Sohn,Jordan Awan
発行日 2023-05-05 15:15:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CG, cs.CR, cs.LG, math.AT, stat.ML パーマリンク