A step towards the applicability of algorithms based on invariant causal learning on observational data




– 機械学習の解釈のために因果発見・推論を利用することができる。
– 多くの訓練環境を使用して不変関係を見つけることで OOD 一般化のためにいくつかの不変学習アルゴリズムが提案されている。
– これらアルゴリズムの一部は因果発見に焦点を当てた不変因果予測(ICP)であり、興味のある変数の因果的親を見つける。また、不変リスク最小化(IRM)は OOD 環境で一般的な予測子を直接提供する。
– こうしたアルゴリズムは、因果推論の文脈で異なる介入を表す複数の環境を前提としているが、観測データや現実のアプリケーションではこれらの環境が通常利用できない。
– 本研究では、これら環境を効率的に生成する方法を提案している。ICP をシミュレーションデータに実装し、非教示学習問題の性能を評価した。
– ICP と組み合わせた因果発見の方法を効率的に適用する手法を示した。そして、ICP や他の因果発見手法が通常性能が低下する多くの共変量を持つデータセットの改善バージョンも提案した。


Machine learning can benefit from causal discovery for interpretation and from causal inference for generalization. In this line of research, a few invariant learning algorithms for out-of-distribution (OOD) generalization have been proposed by using multiple training environments to find invariant relationships. Some of them are focused on causal discovery as Invariant Causal Prediction (ICP), which finds causal parents of a variable of interest, and some directly provide a causal optimal predictor that generalizes well in OOD environments as Invariant Risk Minimization (IRM). This group of algorithms works under the assumption of multiple environments that represent different interventions in the causal inference context. Those environments are not normally available when working with observational data and real-world applications. Here we propose a method to generate them in an efficient way. We assess the performance of this unsupervised learning problem by implementing ICP on simulated data. We also show how to apply ICP efficiently integrated with our method for causal discovery. Finally, we proposed an improved version of our method in combination with ICP for datasets with multiple covariates where ICP and other causal discovery methods normally degrade in performance.


著者 Borja Guerrero Santillan
発行日 2023-04-05 08:15:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, stat.ME パーマリンク