GFlowCausal: Generative Flow Networks for Causal Discovery

要約

因果発見は、一連の変数間の因果構造を明らかにすることを目的としています。
スコアベースのアプローチは、主に、定義済みのスコア関数に基づいて最適な有向非巡回グラフ (DAG) を検索することに重点を置いています。
ただし、それらのほとんどは、検索可能性が限られているため、大規模には適用できません。
生成フロー ネットワークのアクティブ ラーニングに着想を得て、GFlowCausal と呼ばれる観測データから DAG を学習する新しいアプローチを提案します。
グラフ探索問題を生成問題に変換し、直接エッジを徐々に追加します。
GFlowCausal は、事前に定義された報酬に比例する確率を持つ連続したアクションによって、高報酬の DAG を生成するための最良のポリシーを学習することを目的としています。
効率的なサンプリングを確保するために、推移閉包に基づくプラグアンドプレイ モジュールを提案します。
理論的分析は、このモジュールが非周期性プロパティを効果的に保証し、最終状態と完全に接続されたグラフの間の一貫性を保証できることを示しています。
合成データセットと実際のデータセットの両方で広範な実験を行った結果、提案されたアプローチが優れていることが示され、大規模な設定でもうまく機能します。

要約(オリジナル)

Causal discovery aims to uncover causal structure among a set of variables. Score-based approaches mainly focus on searching for the best Directed Acyclic Graph (DAG) based on a predefined score function. However, most of them are not applicable on a large scale due to the limited searchability. Inspired by the active learning in generative flow networks, we propose a novel approach to learning a DAG from observational data called GFlowCausal. It converts the graph search problem to a generation problem, in which direct edges are added gradually. GFlowCausal aims to learn the best policy to generate high-reward DAGs by sequential actions with probabilities proportional to predefined rewards. We propose a plug-and-play module based on transitive closure to ensure efficient sampling. Theoretical analysis shows that this module could guarantee acyclicity properties effectively and the consistency between final states and fully-connected graphs. We conduct extensive experiments on both synthetic and real datasets, and results show the proposed approach to be superior and also performs well in a large-scale setting.

arxiv情報

著者 Wenqian Li,Yinchuan Li,Shengyu Zhu,Yunfeng Shao,Jianye Hao,Yan Pang
発行日 2023-03-10 06:52:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク