要約
カウント データは、金融、神経科学、疫学などの多くの分野で自然に発生し、カウント データ間の因果構造を発見することは、さまざまな科学および産業シナリオにおいて重要なタスクです。
カウント データの最も一般的な特性の 1 つは、二項間引き演算子と分岐とノイズの両方を捕捉する独立したポアソン分布によって記述される固有の分岐構造です。
たとえば、人口カウントのシナリオでは、死亡率と移民がカウントに寄与し、生存率はベルヌーイ分布に従い、移民はポアソン分布に従います。
しかし、そのようなデータから因果関係を発見することは、識別不可能性の問題により困難です。単一の因果ペアはマルコフ等価です。つまり、$X\rightarrow Y$ と $Y\rightarrow X$ は分散等価です。
幸いなことに、今回の研究では、$X$ がルート頂点であり、$Y$ または $X の祖先への少なくとも 2 つの有向パスがある場合、$X$ からその子 $Y$ への因果的順序が識別可能であることがわかりました。
$X$ への最も有向なパスを持つ $ は、$X$ を通さずに $Y$ への有向パスを持ちます。
具体的には、ポアソン分岐構造因果モデル (PB-SCM) を提案し、高次キュムラントを用いた PB-SCM のパス解析を実行します。
理論的な結果は、パスとキュムラントの間の関係を確立し、パス情報がキュムラントから取得できることを示しています。
パス情報を使用すると、いくつかのグラフィック条件下で因果関係の順序を識別できます。
PB-SCMの下で因果構造を学習するための実用的なアルゴリズムを提案し、実験により提案された方法の有効性を実証および検証した。
要約(オリジナル)
Count data naturally arise in many fields, such as finance, neuroscience, and epidemiology, and discovering causal structure among count data is a crucial task in various scientific and industrial scenarios. One of the most common characteristics of count data is the inherent branching structure described by a binomial thinning operator and an independent Poisson distribution that captures both branching and noise. For instance, in a population count scenario, mortality and immigration contribute to the count, where survival follows a Bernoulli distribution, and immigration follows a Poisson distribution. However, causal discovery from such data is challenging due to the non-identifiability issue: a single causal pair is Markov equivalent, i.e., $X\rightarrow Y$ and $Y\rightarrow X$ are distributed equivalent. Fortunately, in this work, we found that the causal order from $X$ to its child $Y$ is identifiable if $X$ is a root vertex and has at least two directed paths to $Y$, or the ancestor of $X$ with the most directed path to $X$ has a directed path to $Y$ without passing $X$. Specifically, we propose a Poisson Branching Structure Causal Model (PB-SCM) and perform a path analysis on PB-SCM using high-order cumulants. Theoretical results establish the connection between the path and cumulant and demonstrate that the path information can be obtained from the cumulant. With the path information, causal order is identifiable under some graphical conditions. A practical algorithm for learning causal structure under PB-SCM is proposed and the experiments demonstrate and verify the effectiveness of the proposed method.
arxiv情報
著者 | Jie Qiao,Yu Xiang,Zhengming Chen,Ruichu Cai,Zhifeng Hao |
発行日 | 2024-03-25 08:06:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google