Causality-Aware Spatiotemporal Graph Neural Networks for Spatiotemporal Time Series Imputation

要約

時空間時系列は通常、さまざまな場所に配置された監視センサーを介して収集されますが、通常、さまざまな機械的故障による欠損値が含まれています。
欠損値の代入は、時系列を分析するために重要です。
特定のデータ ポイントを回復する場合、ほとんどの既存の方法では、因果関係に関係なく、そのポイントに関連するすべての情報が考慮されます。
データ収集中に、時系列の背景ノイズや構築されたセンサー ネットワーク内の非因果的なショートカット エッジなど、未知の交絡因子が含まれることは避けられません。
これらの交絡因子はバックドア パスを開き、入力と出力の間に因果関係のない相関関係を確立する可能性があります。
これらの非因果関係を過度に利用すると、過剰適合が発生する可能性があります。
この論文では、最初に因果関係の観点から時空間補完を再検討し、フロントドア調整によって交絡因子をブロックする方法を示します。
フロントドア調整の結果に基づいて、新しいプロンプト ベース デコーダー (PBD) と時空間因果注意 (SCA) を含む新しい因果関係認識時空間グラフ ニューラル ネットワーク (Casper) を導入します。
PBD は交絡因子の影響を軽減でき、SCA は埋め込み間の疎な因果関係を発見できます。
理論分析により、SCA は勾配の値に基づいて因果関係を発見することが明らかになりました。
私たちは 3 つの現実世界のデータセットで Casper を評価しました。実験結果は、Casper がベースラインを上回り、因果関係を効果的に発見できることを示しています。

要約(オリジナル)

Spatiotemporal time series are usually collected via monitoring sensors placed at different locations, which usually contain missing values due to various mechanical failures. Imputing the missing values is crucial for analyzing time series. When recovering a specific data point, most existing methods consider all the information relevant to that point regardless of the cause-and-effect relationship. During data collection, it is inevitable that some unknown confounders are included, e.g., background noise in time series and non-causal shortcut edges in the constructed sensor network. These confounders could open backdoor paths and establish non-causal correlations between the input and output. Over-exploiting these non-causal correlations could cause overfitting. In this paper, we first revisit spatiotemporal time series imputation from a causal perspective and show how to block the confounders via the frontdoor adjustment. Based on the results of frontdoor adjustment, we introduce a novel Causality-Aware Spatiotemporal Graph Neural Network (Casper), which contains a novel Prompt Based Decoder (PBD) and a Spatiotemporal Causal Attention (SCA). PBD could reduce the impact of confounders and SCA could discover the sparse causal relationships among embeddings. Theoretical analysis reveals that SCA discovers causal relationships based on the values of gradients. We evaluate Casper on three real-world datasets, and the experimental results show that Casper could outperform the baselines and could effectively discover causal relationships.

arxiv情報

著者 Baoyu Jing,Dawei Zhou,Kan Ren,Carl Yang
発行日 2024-08-16 14:47:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク