Tree Search in DAG Space with Model-based Reinforcement Learning for Causal Discovery

要約

因果構造の特定は、戦略的意思決定から生物学や経済学に至るまで、多くの分野の中心となっています。
この研究では、有向非巡回グラフを増分的に構築するツリー探索に基づく因果発見のためのモデルベースの強化学習方法を提案します。
また、サイクルを導入するエッジを除外するための効率的なアルゴリズムの正しさを形式化し、証明します。これにより、DAG 空間でのより深い離散検索とサンプリングが可能になります。
私たちは 2 つの現実世界のタスクに対するアプローチを評価し、最先端のモデルフリー手法と貪欲な検索よりも大幅に優れたパフォーマンスを達成し、組み合わせ手法の有望な進歩を構成しています。

要約(オリジナル)

Identifying causal structure is central to many fields ranging from strategic decision-making to biology and economics. In this work, we propose a model-based reinforcement learning method for causal discovery based on tree search, which builds directed acyclic graphs incrementally. We also formalize and prove the correctness of an efficient algorithm for excluding edges that would introduce cycles, which enables deeper discrete search and sampling in DAG space. We evaluate our approach on two real-world tasks, achieving substantially better performance than the state-of-the-art model-free method and greedy search, constituting a promising advancement for combinatorial methods.

arxiv情報

著者 Victor-Alexandru Darvariu,Stephen Hailes,Mirco Musolesi
発行日 2023-10-20 15:14:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク