要約
データセットに存在する対称性が、変分自動エンコーダー(VAE)によって学習された潜在空間の構造にどのように影響するかを調査します。
単純な機械システムと粒子衝突に由来するデータに関するVAEをトレーニングすることにより、最も意味のある潜在的方向を識別する関連測定を通じて、潜在空間の構成を分析します。
対称性または近似対称性が存在する場合、VAEは潜在空間を自己組織化し、潜在変数の数の減少に沿ってデータを効果的に圧縮することを示します。
この動作は、対称性の制約によって決定される固有の次元をキャプチャし、特徴間の隠れた関係を明らかにします。
さらに、単純なおもちゃモデルの理論的分析を提供し、理想化された条件下で、潜在空間がデータマニホールドの対称方向にどのように整合するかを示します。
これらの調査結果を、2次元データセットから$ o(2)$対称性を持つ2次元データセットから、電子ポジトロンおよびプロトンプロトン衝突からの現実的なデータセットまでの範囲で説明します。
私たちの結果は、監視されていない生成モデルがデータの基礎となる構造を公開する可能性を強調し、明示的な監督なしで対称的発見に対する新しいアプローチを提供します。
要約(オリジナル)
We investigate how symmetries present in datasets affect the structure of the latent space learned by Variational Autoencoders (VAEs). By training VAEs on data originating from simple mechanical systems and particle collisions, we analyze the organization of the latent space through a relevance measure that identifies the most meaningful latent directions. We show that when symmetries or approximate symmetries are present, the VAE self-organizes its latent space, effectively compressing the data along a reduced number of latent variables. This behavior captures the intrinsic dimensionality determined by the symmetry constraints and reveals hidden relations among the features. Furthermore, we provide a theoretical analysis of a simple toy model, demonstrating how, under idealized conditions, the latent space aligns with the symmetry directions of the data manifold. We illustrate these findings with examples ranging from two-dimensional datasets with $O(2)$ symmetry to realistic datasets from electron-positron and proton-proton collisions. Our results highlight the potential of unsupervised generative models to expose underlying structures in data and offer a novel approach to symmetry discovery without explicit supervision.
arxiv情報
著者 | Veronica Sanz |
発行日 | 2025-04-07 15:17:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google