要約
データの欠落は、多くの因果関係発見タスクで頻繁に発生する避けられない複雑な問題です。
欠損プロセスが欠損値自体に依存している場合 (自己マスキング欠損と呼ばれる)、結合分布の回復は達成できなくなり、そのような自己マスキング欠損の存在を検出することは依然として困難な課題です。
その結果、元の分布を再構築することができず、根底にある欠落メカニズムを識別することができないため、既存の因果関係発見手法を単純に適用すると、誤った結論につながる可能性があります。
この研究では、最近進歩した加法性ノイズモデルが、自己マスキング欠損の存在下で因果構造を学習できる可能性があることを発見しました。
この観察により、「自己マスキング欠損がない」という仮定を適切に排除できる、さまざまな欠損メカニズムを備えた加法的ノイズモデルの下で、欠損データから因果構造を学習する同定問題を調査することを目的としています。
具体的には、まず、因果骨格の識別可能性の範囲を、自己マスキング欠損が弱い場合(つまり、それ自体以外に他の変数が自己マスキング指標の原因となり得ない)にエレガントに拡張します。
さらに、加法性ノイズモデルの下で因果方向の十分かつ必要な識別条件を提供し、因果構造が IN 相当パターンまで識別できることを示します。
最後に、因果骨格と因果方向の学習に関する上記の理論的結果に基づいて、実用的なアルゴリズムを提案します。
合成データと実際のデータに関する広範な実験により、提案されたアルゴリズムの効率と有効性が実証されています。
要約(オリジナル)
Missing data are an unavoidable complication frequently encountered in many causal discovery tasks. When a missing process depends on the missing values themselves (known as self-masking missingness), the recovery of the joint distribution becomes unattainable, and detecting the presence of such self-masking missingness remains a perplexing challenge. Consequently, due to the inability to reconstruct the original distribution and to discern the underlying missingness mechanism, simply applying existing causal discovery methods would lead to wrong conclusions. In this work, we found that the recent advances additive noise model has the potential for learning causal structure under the existence of the self-masking missingness. With this observation, we aim to investigate the identification problem of learning causal structure from missing data under an additive noise model with different missingness mechanisms, where the `no self-masking missingness’ assumption can be eliminated appropriately. Specifically, we first elegantly extend the scope of identifiability of causal skeleton to the case with weak self-masking missingness (i.e., no other variable could be the cause of self-masking indicators except itself). We further provide the sufficient and necessary identification conditions of the causal direction under additive noise model and show that the causal structure can be identified up to an IN-equivalent pattern. We finally propose a practical algorithm based on the above theoretical results on learning the causal skeleton and causal direction. Extensive experiments on synthetic and real data demonstrate the efficiency and effectiveness of the proposed algorithms.
arxiv情報
著者 | Jie Qiao,Zhengming Chen,Jianhua Yu,Ruichu Cai,Zhifeng Hao |
発行日 | 2023-12-19 14:44:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google