要約
私たちは、表現学習における潜在変数の特定と「サポート外」の画像生成の問題に取り組みます。
我々は、加算的と呼ぶデコーダのクラスでは両方が可能であることを示します。これは、オブジェクト中心表現学習 (OCRL) に使用されるデコーダを彷彿とさせ、オブジェクト固有の画像の合計として分解できる画像に適しています。
我々は、加算デコーダを使用して再構成問題を正確に解くことで、順列およびブロック単位の可逆変換に至るまでの潜在変数のブロックを識別することが保証される条件を提供します。
この保証は、潜在因子の分布に関する非常に弱い仮定にのみ依存しており、統計的な依存関係が存在し、ほぼ任意の形状のサポートを持つ可能性があります。
私たちの結果は、非線形独立成分分析 (ICA) が可能な新しい設定を提供し、OCRL 手法の理論的理解をさらに深めます。
また、加法デコーダが観察された変動要因を新しい方法で再結合することによって新しい画像を生成できることを理論的に示します。この能力をデカルト積外挿と呼んでいます。
我々は、シミュレートされたデータの識別可能性と外挿の両方にとって加成性が重要であることを経験的に示します。
要約(オリジナル)
We tackle the problems of latent variables identification and “out-of-support” image generation in representation learning. We show that both are possible for a class of decoders that we call additive, which are reminiscent of decoders used for object-centric representation learning (OCRL) and well suited for images that can be decomposed as a sum of object-specific images. We provide conditions under which exactly solving the reconstruction problem using an additive decoder is guaranteed to identify the blocks of latent variables up to permutation and block-wise invertible transformations. This guarantee relies only on very weak assumptions about the distribution of the latent factors, which might present statistical dependencies and have an almost arbitrarily shaped support. Our result provides a new setting where nonlinear independent component analysis (ICA) is possible and adds to our theoretical understanding of OCRL methods. We also show theoretically that additive decoders can generate novel images by recombining observed factors of variations in novel ways, an ability we refer to as Cartesian-product extrapolation. We show empirically that additivity is crucial for both identifiability and extrapolation on simulated data.
arxiv情報
著者 | Sébastien Lachapelle,Divyat Mahajan,Ioannis Mitliagkas,Simon Lacoste-Julien |
発行日 | 2023-11-02 16:02:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google