Identification of Nonlinear Latent Hierarchical Models

要約

観察データから潜在変数と因果構造を特定することは、生物学的データ、医療データ、画像や言語などの非構造化データを含む多くの実世界のアプリケーションにとって不可欠です。
ただし、このタスクは、特に観測変数が因果関係のある潜在変数によって生成され、その関係が非線形である場合には、非常に困難になる可能性があります。
この研究では、観測変数が因果関係のある一連の潜在変数によって生成され、一部の潜在変数には観測された子が存在しない可能性がある、非線形潜在階層因果モデルの同定問題を調査します。
我々は、因果構造と潜在変数(可逆変換まで)の識別可能性が穏やかな仮定の下で達成できることを示します。因果構造では、グラフ内の変数の任意のペア間の複数のパスを許可し、以前の研究での潜在ツリーの仮定を緩和します。
;
構造関数に関しては、一般的な非線形性と多次元連続変数を許可し、既存の研究のパラメトリックな仮定を緩和します。
具体的には、まず、基本的な潜在変数モデルに対する新しい識別可能性の保証の形で識別基準を開発します。
この基準を活用して、階層モデルの因果構造と潜在変数の両方が、推定手順を明示的に構築することによって漸近的に特定できることを示します。
私たちの知る限り、私たちの研究は、非線形潜在階層モデルにおける因果構造と潜在変数の両方の識別可能性の保証を確立した最初のものです。

要約(オリジナル)

Identifying latent variables and causal structures from observational data is essential to many real-world applications involving biological data, medical data, and unstructured data such as images and languages. However, this task can be highly challenging, especially when observed variables are generated by causally related latent variables and the relationships are nonlinear. In this work, we investigate the identification problem for nonlinear latent hierarchical causal models in which observed variables are generated by a set of causally related latent variables, and some latent variables may not have observed children. We show that the identifiability of causal structures and latent variables (up to invertible transformations) can be achieved under mild assumptions: on causal structures, we allow for multiple paths between any pair of variables in the graph, which relaxes latent tree assumptions in prior work; on structural functions, we permit general nonlinearity and multi-dimensional continuous variables, alleviating existing work’s parametric assumptions. Specifically, we first develop an identification criterion in the form of novel identifiability guarantees for an elementary latent variable model. Leveraging this criterion, we show that both causal structures and latent variables of the hierarchical model can be identified asymptotically by explicitly constructing an estimation procedure. To the best of our knowledge, our work is the first to establish identifiability guarantees for both causal structures and latent variables in nonlinear latent hierarchical models.

arxiv情報

著者 Lingjing Kong,Biwei Huang,Feng Xie,Eric Xing,Yuejie Chi,Kun Zhang
発行日 2023-10-31 14:54:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, stat.ML パーマリンク