Weakly-supervised causal discovery based on fuzzy knowledge and complex data complementarity

要約

複雑なシステムの背後にある因果メカニズムを解読するには、観測データに基づく因果関係の発見が重要です。
しかし、既存の因果関係発見手法の有効性は、劣った事前知識、ドメインの不一致、およびサンプルサイズが小さい高次元データセットの課題により制限されています。
このギャップに対処するために、我々は、KEEL と呼ばれる、新しい弱教師ファジー知識とデータ共駆動の因果発見手法を提案します。
KEEL は、ファジー因果知識スキーマを採用して、さまざまなタイプのファジー知識をカプセル化し、対応する弱めの制約を形成します。
このスキーマは、専門知識への依存を軽減するだけでなく、さまざまな種類の限定的でエラーが発生しやすいあいまいな知識を原因の発見に導くことも可能にします。
特に高次元でサンプル数が少ないシナリオにおいて、因果関係発見の一般化と堅牢性を強化できます。
さらに、多重分布や不完全なデータを処理するために、拡張線形因果モデル (ELCM) を KEEL に統合します。
さまざまなデータセットを使用した広範な実験により、精度、堅牢性、計算効率において KEEL がいくつかの最先端の方法よりも優れていることが実証されました。
実際のタンパク質シグナル伝達プロセスにおける因果関係の発見では、KEEL は限られたデータでベンチマーク手法を上回ります。
要約すると、KEEL は、広範なドメイン専門知識の要件を軽減しながら、より高い精度で因果関係発見タスクに取り組むのに効果的です。

要約(オリジナル)

Causal discovery based on observational data is important for deciphering the causal mechanism behind complex systems. However, the effectiveness of existing causal discovery methods is limited due to inferior prior knowledge, domain inconsistencies, and the challenges of high-dimensional datasets with small sample sizes. To address this gap, we propose a novel weakly-supervised fuzzy knowledge and data co-driven causal discovery method named KEEL. KEEL adopts a fuzzy causal knowledge schema to encapsulate diverse types of fuzzy knowledge, and forms corresponding weakened constraints. This schema not only lessens the dependency on expertise but also allows various types of limited and error-prone fuzzy knowledge to guide causal discovery. It can enhance the generalization and robustness of causal discovery, especially in high-dimensional and small-sample scenarios. In addition, we integrate the extended linear causal model (ELCM) into KEEL for dealing with the multi-distribution and incomplete data. Extensive experiments with different datasets demonstrate the superiority of KEEL over several state-of-the-art methods in accuracy, robustness and computational efficiency. For causal discovery in real protein signal transduction processes, KEEL outperforms the benchmark method with limited data. In summary, KEEL is effective to tackle the causal discovery tasks with higher accuracy while alleviating the requirement for extensive domain expertise.

arxiv情報

著者 Wenrui Li,Wei Zhang,Qinghao Zhang,Xuegong Zhang,Xiaowo Wang
発行日 2024-05-14 15:39:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク