要約
データのプライバシーは、機械学習 (ML) においてますます重要な問題になっています。この課題に取り組むために多くのアプローチが開発されています。
暗号化 (準同型暗号化 (HE)、差分プライバシー (DP) など) および共同トレーニング (セキュア マルチパーティ計算 (MPC)、分散学習、および連合学習 (FL))。
これらの手法は、データの暗号化または安全なローカル計算に特に重点を置いています。
中間情報を第三者に転送して、最終結果を計算します。
勾配交換は、一般に、ディープ ラーニング (DL) で堅牢なモデルを共同でトレーニングする安全な方法であると考えられています。
ただし、最近の研究では、共有勾配から機密情報を復元できることが実証されています。
特に、Generative Adversarial Network (GAN) は、そのような情報の回復に効果的であることが示されています。
ただし、GAN ベースの手法では、クラス ラベルなどの追加情報が必要になります。これらの情報は、プライバシーが保護された学習では一般的に利用できません。
この論文では、FL システムでは、提案された生成回帰ニューラル ネットワーク (GRNN) を介してのみ、共有勾配から画像ベースのプライバシー データを完全に簡単に復元できることを示します。
攻撃を回帰問題として定式化し、勾配間の距離を最小化することによって生成モデルの 2 つのブランチを最適化します。
いくつかの画像分類タスクでこの方法を評価します。
結果は、提案された GRNN が、安定性が高く、堅牢性が高く、精度が高い最先端の方法よりも優れていることを示しています。
また、グローバル FL モデルへの収束要件もありません。
さらに、顔の再識別を使用した情報漏えいを実証します。
この作品では、いくつかの防御戦略についても説明されています。
要約(オリジナル)
Data privacy has become an increasingly important issue in Machine Learning (ML), where many approaches have been developed to tackle this challenge, e.g. cryptography (Homomorphic Encryption (HE), Differential Privacy (DP), etc.) and collaborative training (Secure Multi-Party Computation (MPC), Distributed Learning and Federated Learning (FL)). These techniques have a particular focus on data encryption or secure local computation. They transfer the intermediate information to the third party to compute the final result. Gradient exchanging is commonly considered to be a secure way of training a robust model collaboratively in Deep Learning (DL). However, recent researches have demonstrated that sensitive information can be recovered from the shared gradient. Generative Adversarial Network (GAN), in particular, has shown to be effective in recovering such information. However, GAN based techniques require additional information, such as class labels which are generally unavailable for privacy-preserved learning. In this paper, we show that, in the FL system, image-based privacy data can be easily recovered in full from the shared gradient only via our proposed Generative Regression Neural Network (GRNN). We formulate the attack to be a regression problem and optimize two branches of the generative model by minimizing the distance between gradients. We evaluate our method on several image classification tasks. The results illustrate that our proposed GRNN outperforms state-of-the-art methods with better stability, stronger robustness, and higher accuracy. It also has no convergence requirement to the global FL model. Moreover, we demonstrate information leakage using face re-identification. Some defense strategies are also discussed in this work.
arxiv情報
著者 | Hanchi Ren,Jingjing Deng,Xianghua Xie |
発行日 | 2022-09-12 12:42:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google