Identification of Nonlinear Latent Hierarchical Models

要約

観察データから潜在変数と因果構造を特定することは、生物学的データ、医療データ、画像や言語などの非構造化データを含む多くの実世界のアプリケーションにとって不可欠です。
ただし、このタスクは、特に観測変数が因果関係のある潜在変数によって生成され、その関係が非線形である場合には、非常に困難になる可能性があります。
この研究では、観測変数が因果関係のある一連の潜在変数によって生成され、一部の潜在変数には観測された子が存在しない可能性がある、非線形潜在階層因果モデルの同定問題を調査します。
我々は、因果構造と潜在変数の両方の識別可能性が穏やかな仮定の下で達成できることを示します。因果構造では、グラフ内の変数の任意のペア間に複数のパスの存在を許可します。これにより、以前の研究における潜在ツリーの仮定が緩和されます。
構造関数に関しては、パラメトリックな仮定を行わないため、一般的な非線形性と多次元連続変数が許容されます。
具体的には、まず、基本的な潜在変数モデルに対する新しい識別可能性の保証の形で基本的な識別基準を開発します。
この基準を活用して、階層モデルの因果構造と潜在変数の両方が、推定手順を明示的に構築することによって漸近的に特定できることを示します。
私たちの知る限り、私たちの研究は、非線形潜在階層モデルにおける因果構造と潜在変数の両方の識別可能性の保証を確立した最初のものです。

要約(オリジナル)

Identifying latent variables and causal structures from observational data is essential to many real-world applications involving biological data, medical data, and unstructured data such as images and languages. However, this task can be highly challenging, especially when observed variables are generated by causally related latent variables and the relationships are nonlinear. In this work, we investigate the identification problem for nonlinear latent hierarchical causal models in which observed variables are generated by a set of causally related latent variables, and some latent variables may not have observed children. We show that the identifiability of both causal structure and latent variables can be achieved under mild assumptions: on causal structures, we allow for the existence of multiple paths between any pair of variables in the graph, which relaxes latent tree assumptions in prior work; on structural functions, we do not make parametric assumptions, thus permitting general nonlinearity and multi-dimensional continuous variables. Specifically, we first develop a basic identification criterion in the form of novel identifiability guarantees for an elementary latent variable model. Leveraging this criterion, we show that both causal structures and latent variables of the hierarchical model can be identified asymptotically by explicitly constructing an estimation procedure. To the best of our knowledge, our work is the first to establish identifiability guarantees for both causal structures and latent variables in nonlinear latent hierarchical models.

arxiv情報

著者 Lingjing Kong,Biwei Huang,Feng Xie,Eric Xing,Yuejie Chi,Kun Zhang
発行日 2023-06-13 17:19:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク