Score-based Causal Representation Learning: Linear and General Transformations

要約

この論文では、一般的なノンパラメトリック潜在因果モデルおよび潜在変数を観測変数にマッピングする未知の変換の下での介入ベースの因果表現学習 (CRL) について取り上げます。
線形変換と一般変換が調査されます。
この論文では、\emph{識別可能性} と \emph{達成可能性} の両方の側面について取り上げています。
識別可能性とは、真の潜在因果変数とその基礎となる潜在因果グラフを確実に回復する、アルゴリズムに依存しない条件を決定することを指します。
達成可能性はアルゴリズムの側面を指し、識別可能性の保証を達成するアルゴリズムの設計に取り組みます。
\emph{スコア関数} (つまり、密度関数の対数の勾配) と CRL の間の新しい接続を描くことにより、この論文は、識別可能性と達成可能性の両方を保証する \emph{スコアベースのアルゴリズムのクラス} を設計します。
まず、この論文は \emph{linear} 変換に焦点を当てており、ノードごとに 1 回の確率的ハード介入で識別可能性を保証するのに十分であることを示しています。
また、一般因果モデルの祖先までの識別可能性や、十分に非線形な因果モデルの完全な潜在グラフ回復など、ソフト介入の部分的な識別可能性の保証も提供します。
次に、 \emph{general} 変換に焦点を当てており、識別可能性にはノードごとに 2 つの確率的ハード介入で十分であることを示しています。
特に、介入環境のどのペアに同じノードが介入しているかを知る必要は \emph{ありません}。

要約(オリジナル)

This paper addresses intervention-based causal representation learning (CRL) under a general nonparametric latent causal model and an unknown transformation that maps the latent variables to the observed variables. Linear and general transformations are investigated. The paper addresses both the \emph{identifiability} and \emph{achievability} aspects. Identifiability refers to determining algorithm-agnostic conditions that ensure recovering the true latent causal variables and the latent causal graph underlying them. Achievability refers to the algorithmic aspects and addresses designing algorithms that achieve identifiability guarantees. By drawing novel connections between \emph{score functions} (i.e., the gradients of the logarithm of density functions) and CRL, this paper designs a \emph{score-based class of algorithms} that ensures both identifiability and achievability. First, the paper focuses on \emph{linear} transformations and shows that one stochastic hard intervention per node suffices to guarantee identifiability. It also provides partial identifiability guarantees for soft interventions, including identifiability up to ancestors for general causal models and perfect latent graph recovery for sufficiently non-linear causal models. Secondly, it focuses on \emph{general} transformations and shows that two stochastic hard interventions per node suffice for identifiability. Notably, one does \emph{not} need to know which pair of interventional environments have the same node intervened.

arxiv情報

著者 Burak Varıcı,Emre Acartürk,Karthikeyan Shanmugam,Ali Tajer
発行日 2024-02-01 18:40:03+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク