On the Adversarial Robustness of Generative Autoencoders in the Latent Space

要約

変分オートエンコーダや敵対的オートエンコーダなどの生成オートエンコーダは、画像生成や信号通信などの多くの実世界のアプリケーションで大きな成功を収めています。
しかし、実際の展開時の堅牢性についてはほとんど関心が払われてきませんでした。
確率的潜在構造により、変分オートエンコーダー (VAE) は、潜在データ多様体の事後分布と実際のデータ多様体の間の不一致や潜在データの事後分布の不連続などの問題に直面する可能性があります。
これにより、特に通信や圧縮センシングなど、エンコーダとデコーダが別々に使用されるシナリオでは、悪意のある攻撃者が潜在空間から VAE を破壊するためのバックドアが残されます。
この研究では、潜在空間における生成オートエンコーダの敵対的堅牢性に関する最初の研究を提供します。
具体的には、潜在空間での攻撃を通じて、一般的な生成オートエンコーダーの潜在的な脆弱性を経験的に実証します。
また、変分オートエンコーダとその決定論的バリアントの違いを評価し、後者の方が潜在的なロバスト性において優れたパフォーマンスを発揮することを観察しました。
一方、我々は、敵対的な堅牢性と潜在コードのもつれを解く程度との間の潜在的なトレードオフを特定します。
さらに、敵対的トレーニングを通じて VAE の潜在的な堅牢性の改善の実現可能性も検証します。
要約すると、生成オートエンコーダーの敵対的な潜在的な堅牢性について提案し、堅牢性に関連するいくつかの問題を分析し、一連の主要な課題についていくつかの洞察を提供します。

要約(オリジナル)

The generative autoencoders, such as the variational autoencoders or the adversarial autoencoders, have achieved great success in lots of real-world applications, including image generation, and signal communication. However, little concern has been devoted to their robustness during practical deployment. Due to the probabilistic latent structure, variational autoencoders (VAEs) may confront problems such as a mismatch between the posterior distribution of the latent and real data manifold, or discontinuity in the posterior distribution of the latent. This leaves a back door for malicious attackers to collapse VAEs from the latent space, especially in scenarios where the encoder and decoder are used separately, such as communication and compressed sensing. In this work, we provide the first study on the adversarial robustness of generative autoencoders in the latent space. Specifically, we empirically demonstrate the latent vulnerability of popular generative autoencoders through attacks in the latent space. We also evaluate the difference between variational autoencoders and their deterministic variants and observe that the latter performs better in latent robustness. Meanwhile, we identify a potential trade-off between the adversarial robustness and the degree of the disentanglement of the latent codes. Additionally, we also verify the feasibility of improvement for the latent robustness of VAEs through adversarial training. In summary, we suggest concerning the adversarial latent robustness of the generative autoencoders, analyze several robustness-relative issues, and give some insights into a series of key challenges.

arxiv情報

著者 Mingfei Lu,Badong Chen
発行日 2023-07-05 10:53:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CR, cs.LG パーマリンク