SLEM: Machine Learning for Path Modeling and Causal Inference with Super Learner Equation Modeling

要約

因果推論は科学の重要な目標であり、研究者が観察データを使用して仮説的介入の予測に関して有意義な結論に達することを可能にします。
パス モデル、構造方程式モデル (SEM)、そしてより一般的には有向非巡回グラフ (DAG) は、現象の根底にある因果構造に関する仮定を明確に指定する手段を提供します。
関数形式およびパラメトリック形式についてほとんど仮定を行わない DAG とは異なり、SEM は線形性を仮定します。
これにより、機能の仕様の誤りが発生し、研究者が信頼できる効果量の推定を行うことができなくなる可能性があります。
対照的に、私たちは、機械学習スーパーラーナー アンサンブルを統合するパス モデリング手法であるスーパーラーナー方程式モデリングを提案します。
私たちは、因果関係の一貫した偏りのない推定を提供する能力、SEM と比較した場合の線形モデルの競合パフォーマンスを実証し、非線形関係を扱う場合の SEM に対する優位性を強調します。
オープンソース コードと使用例を記載したチュートリアル ノートブックを提供し、このメソッドの使いやすさを強調しています。

要約(オリジナル)

Causal inference is a crucial goal of science, enabling researchers to arrive at meaningful conclusions regarding the predictions of hypothetical interventions using observational data. Path models, Structural Equation Models (SEMs), and, more generally, Directed Acyclic Graphs (DAGs), provide a means to unambiguously specify assumptions regarding the causal structure underlying a phenomenon. Unlike DAGs, which make very few assumptions about the functional and parametric form, SEM assumes linearity. This can result in functional misspecification which prevents researchers from undertaking reliable effect size estimation. In contrast, we propose Super Learner Equation Modeling, a path modeling technique integrating machine learning Super Learner ensembles. We empirically demonstrate its ability to provide consistent and unbiased estimates of causal effects, its competitive performance for linear models when compared with SEM, and highlight its superiority over SEM when dealing with non-linear relationships. We provide open-source code, and a tutorial notebook with example usage, accentuating the easy-to-use nature of the method.

arxiv情報

著者 Matthew J. Vowels
発行日 2023-08-10 07:44:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.AP, stat.ML パーマリンク