Sortability of Time Series Data

要約

時間依存プロセス間の因果関係を発見することを目的とした因果発見アルゴリズムのパフォーマンスを評価することは、依然として難しい課題です。
この論文では、varsortability (Reisach et al. 2021) や $R^2$-sortability (Reisach et al. 2023) などのデータセットの特定の特性が、自己相関定常時系列のデータセットでも発生することを示します。
我々は、4 種類のデータを使用してこれを実証的に説明します。SVAR モデルと Erd\H{o}s-R\’enyi グラフに基づくシミュレーション データ、2019 年の気候因果関係チャレンジで使用されたデータ (Runge et al. 2019)、実際のデータ
– 世界の河川データセット、および Causal Chamber によって生成された現実世界のデータ (Gamella et al. 2024)。
これを行うために、var-および $R^2$-sortability を時系列データに適応させます。
また、スコアベースの因果関係発見手法のパフォーマンスと高い並べ替え可能性がどの程度連携しているかについても調査します。
おそらく、私たちの最も驚くべき発見は、調査された現実世界のデータセットが高い可変ソート可能性と低い $R^2$ ソート可能性を示し、スケールがかなりの量の因果情報を保持している可能性があることを示しているということです。

要約(オリジナル)

Evaluating the performance of causal discovery algorithms that aim to find causal relationships between time-dependent processes remains a challenging topic. In this paper, we show that certain characteristics of datasets, such as varsortability (Reisach et al. 2021) and $R^2$-sortability (Reisach et al. 2023), also occur in datasets for autocorrelated stationary time series. We illustrate this empirically using four types of data: simulated data based on SVAR models and Erd\H{o}s-R\’enyi graphs, the data used in the 2019 causality-for-climate challenge (Runge et al. 2019), real-world river stream datasets, and real-world data generated by the Causal Chamber of (Gamella et al. 2024). To do this, we adapt var- and $R^2$-sortability to time series data. We also investigate the extent to which the performance of score-based causal discovery methods goes hand in hand with high sortability. Arguably, our most surprising finding is that the investigated real-world datasets exhibit high varsortability and low $R^2$-sortability indicating that scales may carry a significant amount of causal information.

arxiv情報

著者 Christopher Lohse,Jonas Wahl
発行日 2024-07-23 14:34:47+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク