Causal hybrid modeling with double machine learning

要約

ハイブリッド・モデリングは、解釈可能性、一般化、自然法則への準拠を高めるために、機械学習と科学的知識を統合する。とはいえ、これらの目的を達成するためのハイブリッドモデリングには、均等性と正則化のバイアスが課題となる。本論文では、因果推論の枠組みを介してハイブリッドモデルを推定する新しいアプローチを紹介する。特に、因果効果を推定するためにダブル機械学習(DML)を採用する。DMLの地球科学への応用を、二酸化炭素フラックスに関する2つの問題で紹介する。Q_{10}$モデルでは、DMLベースのハイブリッドモデリングが、エンドツーエンドのディープニューラルネットワーク(DNN)アプローチよりも因果パラメータの推定において優れていることを実証し、効率性、正則化手法によるバイアスに対する頑健性、等価性の回避を証明する。炭素フラックスの分割に適用された我々のアプローチは、異種因果効果に柔軟に対応することができる。本研究は、因果グラフと因果関係を明示的に定義する必要性を強調し、これを一般的なベストプラクティスとして提唱している。知識誘導型機械学習において、より解釈しやすく信頼できる結果を得るために、ハイブリッドモデルにおける因果関係の探求を続けることを奨励する。

要約(オリジナル)

Hybrid modeling integrates machine learning with scientific knowledge to enhance interpretability, generalization, and adherence to natural laws. Nevertheless, equifinality and regularization biases pose challenges in hybrid modeling to achieve these purposes. This paper introduces a novel approach to estimating hybrid models via a causal inference framework, specifically employing Double Machine Learning (DML) to estimate causal effects. We showcase its use for the Earth sciences on two problems related to carbon dioxide fluxes. In the $Q_{10}$ model, we demonstrate that DML-based hybrid modeling is superior in estimating causal parameters over end-to-end deep neural network (DNN) approaches, proving efficiency, robustness to bias from regularization methods, and circumventing equifinality. Our approach, applied to carbon flux partitioning, exhibits flexibility in accommodating heterogeneous causal effects. The study emphasizes the necessity of explicitly defining causal graphs and relationships, advocating for this as a general best practice. We encourage the continued exploration of causality in hybrid models for more interpretable and trustworthy results in knowledge-guided machine learning.

arxiv情報

著者 Kai-Hendrik Cohrs,Gherardo Varando,Nuno Carvalhais,Markus Reichstein,Gustau Camps-Valls
発行日 2024-04-04 14:02:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, stat.ME パーマリンク