SpaCE: The Spatial Confounding Environment

要約

空間データを含む科学的研究において、空間的交絡は重要な課題である。未観測の空間変数が治療と結果の両方に影響を及ぼし、偽の関連につながる可能性がある。この問題に対処するために、我々はSpaCE: The Spatial Confounding Environmentを紹介する。このツールキットは、空間的交絡を緩和するように設計された因果推論手法を系統的に評価するための、現実的なベンチマークデータセットとツールを提供する初めてのツールキットである。各データセットには、訓練データ、真の反事実、座標を持つ空間グラフ、欠落した空間的交絡因子の影響を特徴付ける平滑度と交絡スコアが含まれる。また、因果推論ベンチマークのベストプラクティスに従い、最先端の機械学習アンサンブルを用いて生成された、現実的な半合成結果と反事実も含まれている。データセットは、気候、健康、社会科学など多様な領域における実際の治療と共変量をカバーしている。SpaCEは、自動化されたエンドツーエンドのパイプラインを促進し、データのロード、実験のセットアップ、機械学習と因果推論モデルの評価を簡素化します。SpaCEプロジェクトは、多様なサイズと空間的複雑性を持つ数十のデータセットを提供しています。Pythonパッケージとして公開されており、コミュニティからのフィードバックや貢献を奨励しています。

要約(オリジナル)

Spatial confounding poses a significant challenge in scientific studies involving spatial data, where unobserved spatial variables can influence both treatment and outcome, possibly leading to spurious associations. To address this problem, we introduce SpaCE: The Spatial Confounding Environment, the first toolkit to provide realistic benchmark datasets and tools for systematically evaluating causal inference methods designed to alleviate spatial confounding. Each dataset includes training data, true counterfactuals, a spatial graph with coordinates, and smoothness and confounding scores characterizing the effect of a missing spatial confounder. It also includes realistic semi-synthetic outcomes and counterfactuals, generated using state-of-the-art machine learning ensembles, following best practices for causal inference benchmarks. The datasets cover real treatment and covariates from diverse domains, including climate, health and social sciences. SpaCE facilitates an automated end-to-end pipeline, simplifying data loading, experimental setup, and evaluating machine learning and causal inference models. The SpaCE project provides several dozens of datasets of diverse sizes and spatial complexity. It is publicly available as a Python package, encouraging community feedback and contributions.

arxiv情報

著者 Mauricio Tec,Ana Trisovic,Michelle Audirac,Sophie Woodward,Naeem Khoshnevis,Francesca Dominici
発行日 2023-12-01 16:42:57+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, stat.ME, stat.ML パーマリンク