dotears: Scalable, consistent DAG estimation using observational and interventional data

要約

データから因果有向非巡回グラフ (DAG) を学習することは、識別可能性と解の組み合わせ空間の欠如により複雑になります。
最近の研究では、観察データにおける DAG のスコアベースの構造学習の扱いやすさが向上しましたが、外生誤差分散の構造の影響を受けやすくなっています。
一方、観察データから外生分散構造を学習するには、構造に関する事前の知識が必要です。
高度に並行した遺伝子介入を高次元の観察に結び付ける新しい生物学的技術を動機として、我々は、観察データと介入データを活用して単一の因果構造を推論するスケーラブルな構造学習フレームワークである $\texttt{dotears}$ [doo-tairs] を紹介します。
継続的な最適化を通じて。
$\texttt{dotears}$ は、介入による予測可能な構造的結果を利用して、循環推定問題をバイパスして、外生誤差構造を直接推定します。
以前の研究を拡張して、以前の方法の推論は外生分散構造によって駆動されるが、$\texttt{dotears}$ は外生分散構造に対して堅牢であることを経験的にも分析的にも示しました。
大規模なランダム DAG のさまざまなシミュレーションにわたって、$\texttt{dotears}$ は構造推定において最先端の手法を上回りました。
最後に、$\texttt{dotears}$ が穏やかな仮定の下で真の DAG の一貫性のある推定量であることを示します。

要約(オリジナル)

Learning causal directed acyclic graphs (DAGs) from data is complicated by a lack of identifiability and the combinatorial space of solutions. Recent work has improved tractability of score-based structure learning of DAGs in observational data, but is sensitive to the structure of the exogenous error variances. On the other hand, learning exogenous variance structure from observational data requires prior knowledge of structure. Motivated by new biological technologies that link highly parallel gene interventions to a high-dimensional observation, we present $\texttt{dotears}$ [doo-tairs], a scalable structure learning framework which leverages observational and interventional data to infer a single causal structure through continuous optimization. $\texttt{dotears}$ exploits predictable structural consequences of interventions to directly estimate the exogenous error structure, bypassing the circular estimation problem. We extend previous work to show, both empirically and analytically, that the inferences of previous methods are driven by exogenous variance structure, but $\texttt{dotears}$ is robust to exogenous variance structure. Across varied simulations of large random DAGs, $\texttt{dotears}$ outperforms state-of-the-art methods in structure estimation. Finally, we show that $\texttt{dotears}$ is a provably consistent estimator of the true DAG under mild assumptions.

arxiv情報

著者 Albert Xue,Jingyou Rao,Sriram Sankararaman,Harold Pimentel
発行日 2023-05-30 17:03:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク