要約
固有の同定可能性の問題と、有限なデータの結果の両方により、一意的な因果構造を発見することは困難である。そのため、ベイズ事後推定から得られるような因果構造に対する不確実性が、しばしば下流のタスクに必要とされる。この事後値の正確な近似を見つけることは、可能性のある因果グラフの数が多いことと、因果エッジの機能的関係に対する事後値を見つける副問題が難しいことから、困難である。最近の研究では、最大事後因果グラフを推定する問題を教師付き学習とみなすメタ学習が用いられている。しかし、これらの手法は、エッジ間の相関やノードに関する並べ替えの等変量性など、事後分布の重要な性質を符号化できないため、完全な事後分布を推定する際には限界がある。さらに、これらの手法では、因果構造上の事後値から確実にサンプリングすることもできない。これらの限界に対処するため、我々は、事後的な因果構造のサンプリングを可能にし、これらの重要な性質を符号化するベイズメタ学習モデルを提案する。我々のメタベイズ因果発見を既存のベイズ因果発見手法と比較し、因果構造に対する事後学習の優位性を示す。
要約(オリジナル)
Discovering a unique causal structure is difficult due to both inherent identifiability issues, and the consequences of finite data. As such, uncertainty over causal structures, such as those obtained from a Bayesian posterior, are often necessary for downstream tasks. Finding an accurate approximation to this posterior is challenging, due to the large number of possible causal graphs, as well as the difficulty in the subproblem of finding posteriors over the functional relationships of the causal edges. Recent works have used meta-learning to view the problem of estimating the maximum a-posteriori causal graph as supervised learning. Yet, these methods are limited when estimating the full posterior as they fail to encode key properties of the posterior, such as correlation between edges and permutation equivariance with respect to nodes. Further, these methods also cannot reliably sample from the posterior over causal structures. To address these limitations, we propose a Bayesian meta learning model that allows for sampling causal structures from the posterior and encodes these key properties. We compare our meta-Bayesian causal discovery against existing Bayesian causal discovery methods, demonstrating the advantages of directly learning a posterior over causal structure.
arxiv情報
著者 | Anish Dhir,Matthew Ashman,James Requeima,Mark van der Wilk |
発行日 | 2025-03-03 12:21:35+00:00 |
arxivサイト | arxiv_id(pdf) |