Content-Aware Differential Privacy with Conditional Invertible Neural Networks

要約

差分プライバシー (DP) は、各データ サンプルにキャリブレーションされたノイズを追加することにより、データセット内の個人のプライバシーを保護するためのゴールド スタンダードとして登場しました。
カテゴリ データへの適用は簡単ですが、画像のコンテキストでの使いやすさは限られています。
カテゴリ データとは対照的に、画像の意味は隣接するピクセルの空間相関に固有のものであり、ノイズを単純に適用することは不可能です。
Invertible Neural Networks (INN) は、正確な可能性を定量化する機能を提供しながら、優れた生成パフォーマンスを示しています。
彼らの原則は、複雑な分布を単純なものに変換することに基づいています。
画像を球状ガウスに変換します。
INN の潜在空間にノイズを追加すると、差別的にプライベートな画像変更が可能になると仮定します。
潜在空間を操作することで、重要な詳細を維持しながらイメージを変更できます。
さらに、データセットで提供されるメタデータで INN を調整することにより、識別情報を含む可能性のある他の部分を変更しながら、分類などのダウンストリーム タスクにとって重要な次元をそのままにしておくことを目指しています。
私たちの方法は、コンテンツに応じた差分プライバシー (CADP) と呼ばれます。
私たちは、公開されているベンチマーク データセットと専用の医療用データセットで実験を行っています。
さらに、カテゴリデータに対するこの方法の一般化可能性を示します。
ソース コードは、https://github.com/Cardio-AI/CADP で公開されています。

要約(オリジナル)

Differential privacy (DP) has arisen as the gold standard in protecting an individual’s privacy in datasets by adding calibrated noise to each data sample. While the application to categorical data is straightforward, its usability in the context of images has been limited. Contrary to categorical data the meaning of an image is inherent in the spatial correlation of neighboring pixels making the simple application of noise infeasible. Invertible Neural Networks (INN) have shown excellent generative performance while still providing the ability to quantify the exact likelihood. Their principle is based on transforming a complicated distribution into a simple one e.g. an image into a spherical Gaussian. We hypothesize that adding noise to the latent space of an INN can enable differentially private image modification. Manipulation of the latent space leads to a modified image while preserving important details. Further, by conditioning the INN on meta-data provided with the dataset we aim at leaving dimensions important for downstream tasks like classification untouched while altering other parts that potentially contain identifying information. We term our method content-aware differential privacy (CADP). We conduct experiments on publicly available benchmarking datasets as well as dedicated medical ones. In addition, we show the generalizability of our method to categorical data. The source code is publicly available at https://github.com/Cardio-AI/CADP.

arxiv情報

著者 Malte Tölle,Ullrich Köthe,Florian André,Benjamin Meder,Sandy Engelhardt
発行日 2022-07-29 11:52:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CR, cs.CV, cs.LG, I.2.6 パーマリンク