The Structurally Complex with Additive Parent Causality (SCARY) Dataset

要約

タイトル:Structurally Complex with Additive Parent Causality (SCARY)データセット
要約:この論文はCausal Discovery研究分野の重要な役割を果たす因果関係のデータセットについて述べています。既存のデータセットは、選択バイアス、不正確なデータ、交絡など、現実世界の問題の複雑さに欠けています。このギャップを埋めるために、加算モデルに基づく新しい因果データセット「SCARY」を提案しています。以下の特徴を備えた40のシナリオから構成され、3つの異なるシードで生成され、関連するデータサブセットを利用できます。また、親ノードと子ノードの間の因果関係を生成するために、2つの異なるデータ生成機構を使用します。データ生成機構は「Causal Discovery Toolbox」に触発され、加算モデルのみを生成します。データセットのVarsortabilityは0.5であるため、リサイズ可能です。SCARYデータセットは、研究者がより現実的なシナリオで因果発見を探索するための貴重なリソースを提供します。データセットは、https://github.com/JayJayc/SCARYから入手できます。

– 加算モデルに基づく新しい因果データセット「SCARY」が提案されました。
– SCARYデータセットは、40のシナリオで構成され、3つの異なるシードで生成されたデータを利用することができます。
– 親ノードと子ノードの間の因果関係を生成するために、2つの異なるデータ生成機構を使用します。
– データ生成機構は、「Causal Discovery Toolbox」に触発され、加算モデルのみを生成します。
– Varsortabilityは0.5であるため、リサイズ可能です。
– SCARYデータセットは、現実的なシナリオで因果発見を探索するための貴重なリソースを提供します。

要約(オリジナル)

Causal datasets play a critical role in advancing the field of causality. However, existing datasets often lack the complexity of real-world issues such as selection bias, unfaithful data, and confounding. To address this gap, we propose a new synthetic causal dataset, the Structurally Complex with Additive paRent causalitY (SCARY) dataset, which includes the following features. The dataset comprises 40 scenarios, each generated with three different seeds, allowing researchers to leverage relevant subsets of the dataset. Additionally, we use two different data generation mechanisms for generating the causal relationship between parents and child nodes, including linear and mixed causal mechanisms with multiple sub-types. Our dataset generator is inspired by the Causal Discovery Toolbox and generates only additive models. The dataset has a Varsortability of 0.5. Our SCARY dataset provides a valuable resource for researchers to explore causal discovery under more realistic scenarios. The dataset is available at https://github.com/JayJayc/SCARY.

arxiv情報

著者 Jarry Chen,Haytham M. Fayek
発行日 2023-04-27 11:38:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.LG, stat.ML パーマリンク