要約
有向非循環グラフは、システムの因果構造をモデル化するために使用されます。
「因果関係の発見」では、この構造をデータから学習するという問題について説明します。
データが複数のソース (集団または環境) からの集合体である場合、大域的交絡により、多くの因果関係発見アルゴリズムを推進する条件付き独立性の特性が曖昧になります。
このため、既存の因果関係発見アルゴリズムは複数ソース設定には適していません。
我々は、交絡が境界カーディナリティのものである場合(つまり、データが限られた数のソースから得られる場合)、依然として因果関係の発見が達成できることを実証します。
この問題の実現可能性は、大域交絡因子の濃度、観測変数の濃度、および因果構造のスパース性の間のトレードオフによって決まります。
要約(オリジナル)
Directed acyclic graphs are used to model the causal structure of a system. “Causal discovery” describes the problem of learning this structure from data. When data is an aggregate from multiple sources (populations or environments), global confounding obscures conditional independence properties that drive many causal discovery algorithms. For this reason, existing causal discovery algorithms are not suitable for the multiple-source setting. We demonstrate that, if the confounding is of bounded cardinality (i.e. the data comes from a limited number of sources), causal discovery can still be achieved. The feasibility of this problem is governed by a trade-off between the cardinality of the global confounder, the cardinalities of the observed variables, and the sparsity of the causal structure.
arxiv情報
著者 | Bijan Mazaheri,Spencer Gordon,Yuval Rabani,Leonard Schulman |
発行日 | 2023-11-13 16:35:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google