オートエンコーダ (AE) は表現学習の分野で重要な役割を果たしており、コンパクトで堅牢な表現を学習する能力を強化するだけでなく、さまざまなアーキテクチャが表現の構造と滑らかさにどのような影響を与えるかを明らかにするために開発された多数の正則化手法とトレーニング原理を備えています。
私たちは、畳み込みオートエンコーダー (CAE)、ノイズ除去オートエンコーダー (DAE)、変分オートエンコーダー (VAE) などのさまざまなオートエンコーダーによって学習された潜在空間の構造と、それらが入力の摂動によってどのように変化するかを特徴付けることに努めています。
潜在空間に対応する行列多様体を特徴付けることにより、CAE と DAE の潜在空間は非滑らかな多様体を形成するのに対し、VAE の潜在空間は滑らかな多様体を形成するというよく知られた観察の説明が得られます。
結果は、CAE と DAE の潜在多様体は層化されており、各層は滑らかな積多様体であるのに対し、VAE の多様体は 2 つの対称正定行列と 1 つの対称正定行列の滑らかな積多様体であることがわかります。
Understanding the latent spaces learned by deep learning models is crucial in exploring how they represent and generate complex data. Autoencoders (AEs) have played a key role in the area of representation learning, with numerous regularization techniques and training principles developed not only to enhance their ability to learn compact and robust representations, but also to reveal how different architectures influence the structure and smoothness of the lower-dimensional non-linear manifold. We strive to characterize the structure of the latent spaces learned by different autoencoders including convolutional autoencoders (CAEs), denoising autoencoders (DAEs), and variational autoencoders (VAEs) and how they change with the perturbations in the input. By characterizing the matrix manifolds corresponding to the latent spaces, we provide an explanation for the well-known observation that the latent spaces of CAE and DAE form non-smooth manifolds, while that of VAE forms a smooth manifold. We also map the points of the matrix manifold to a Hilbert space using distance preserving transforms and provide an alternate view in terms of the subspaces generated in the Hilbert space as a function of the distortion in the input. The results show that the latent manifolds of CAE and DAE are stratified with each stratum being a smooth product manifold, while the manifold of VAE is a smooth product manifold of two symmetric positive definite matrices and a symmetric positive semi-definite matrix.
著者 | Anika Shrivastava,Renu Rameshan,Samar Agnihotri |
発行日 | 2025-01-16 14:44:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google