Comparing information content of representation spaces for disentanglement with VAE ensembles

要約

もつれの解除とは、機械学習を使用してデータセットに関する情報を意味のある断片に分割する取り組みです。
実際には、これらのフラグメントは表現 (サブ) 空間であり、多くの場合、変分オートエンコーダー (VAE) の潜在空間内のチャネルのセットです。
もつれの解消の評価では、主にモデル レベルで粗粒度のメトリクスが使用されますが、このアプローチでは情報の断片化のプロセスがかなり曖昧になる可能性があります。
ここでは、反復トレーニング実行のアンサンブルによって学習された情報の断片として、学習されたチャネルを集合的に研究することを提案します。
さらに、我々は、個々の部分空間間の類似性の尺度が確率分布としてのデータ埋め込みの性質を無視していた以前の研究から逸脱します。
代わりに、表現部分空間をデータのソフト クラスタリングを実行する通信チャネルとして見ます。
その結果、表現空間を比較するために、クラスタリング割り当て間の類似性に関する 2 つの古典的な情報理論的尺度を一般化します。
私たちは、データセット サンプルを区別する能力によるフィンガープリンティング表現部分空間に基づく軽量な推定方法を開発し、合成データセットと自然データセットでトレーニングされた VAE のアンサンブル内の意味のある構造を識別、分析、活用できるようにします。
この完全に教師なしのパイプラインを使用して、情報フラグメントの空間内の「ホットスポット」を特定します。これは、特に正則化が増加するにつれて、VAE のアンサンブル内で繰り返し現れる、ほぼ同一の表現部分空間のグループです。
最後に、提案された方法論を活用して、VAE によるアンサンブル学習を実現し、一連の弱学習器の情報コンテンツを強化します。これは、チャネルの類似性を評価する以前の方法では不可能でした。

要約(オリジナル)

Disentanglement is the endeavour to use machine learning to divide information about a dataset into meaningful fragments. In practice these fragments are representation (sub)spaces, often the set of channels in the latent space of a variational autoencoder (VAE). Assessments of disentanglement predominantly employ metrics that are coarse-grained at the model level, but this approach can obscure much about the process of information fragmentation. Here we propose to study the learned channels in aggregate, as the fragments of information learned by an ensemble of repeat training runs. Additionally, we depart from prior work where measures of similarity between individual subspaces neglected the nature of data embeddings as probability distributions. Instead, we view representation subspaces as communication channels that perform a soft clustering of the data; consequently, we generalize two classic information-theoretic measures of similarity between clustering assignments to compare representation spaces. We develop a lightweight method of estimation based on fingerprinting representation subspaces by their ability to distinguish dataset samples, allowing us to identify, analyze, and leverage meaningful structure in ensembles of VAEs trained on synthetic and natural datasets. Using this fully unsupervised pipeline we identify ‘hotspots’ in the space of information fragments: groups of nearly identical representation subspaces that appear repeatedly in an ensemble of VAEs, particularly as regularization is increased. Finally, we leverage the proposed methodology to achieve ensemble learning with VAEs, boosting the information content of a set of weak learners — a capability not possible with previous methods of assessing channel similarity.

arxiv情報

著者 Kieran A. Murphy,Sam Dillavou,Dani S. Bassett
発行日 2024-05-31 17:33:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク