Self-Supervised Deconfounding Against Spatio-Temporal Shifts: Theory and Modeling

要約

時空間 (ST) データの重要なアプリケーションとして、ST 交通予測は都市の移動効率を向上させ、持続可能な開発を促進する上で重要な役割を果たします。
実際には、交通データのダイナミクスは、時間の変化や空間的な違いなどの外部要因に起因する分布の変化を頻繁に受けます。
これには、テスト データがトレーニング データとは異なる方法で配布される配布外 (OOD) 問題を処理する予測モデルが必要になります。
この作業では、まず過去のトラフィック データ、将来のトラフィック データ、および外部 ST コンテキストの因果グラフを構築することで問題を形式化します。
OOD トラフィック データにおける従来技術の失敗は、交絡因子として機能する ST コンテキスト、つまり過去のデータと将来のデータの共通の原因によるものであることを明らかにします。
次に、因果レンズからの解絡コンテキスト調整 (DCA) と呼ばれる理論的解決策を提案します。
これは、不変の因果関係をバリアントの偽の因果関係と区別し、ST コンテキストの影響を混乱させます。
その上で、私たちは時空間自己教師付き混乱解消 (STEVE) フレームワークを考案します。
まず、トラフィック データを 2 つの解かれた表現にエンコードして、不変 ST コンテキストとバリアント ST コンテキストを関連付けます。
次に、概念的に異なる 3 つの観点 (つまり、時間的、空間的、意味的) からの代表的な ST コンテキストを自己教師あり信号として使用し、両方の表現にコンテキスト情報を注入します。
このようにして、学習したコンテキスト指向表現の OOD ST トラフィック予測への汎化能力を向上させます。
4 つの大規模ベンチマーク データセットに対する包括的な実験により、当社の STEVE がさまざまな ST OOD シナリオにわたって一貫して最先端のベースラインを上回るパフォーマンスを発揮することが実証されました。

要約(オリジナル)

As an important application of spatio-temporal (ST) data, ST traffic forecasting plays a crucial role in improving urban travel efficiency and promoting sustainable development. In practice, the dynamics of traffic data frequently undergo distributional shifts attributed to external factors such as time evolution and spatial differences. This entails forecasting models to handle the out-of-distribution (OOD) issue where test data is distributed differently from training data. In this work, we first formalize the problem by constructing a causal graph of past traffic data, future traffic data, and external ST contexts. We reveal that the failure of prior arts in OOD traffic data is due to ST contexts acting as a confounder, i.e., the common cause for past data and future ones. Then, we propose a theoretical solution named Disentangled Contextual Adjustment (DCA) from a causal lens. It differentiates invariant causal correlations against variant spurious ones and deconfounds the effect of ST contexts. On top of that, we devise a Spatio-Temporal sElf-superVised dEconfounding (STEVE) framework. It first encodes traffic data into two disentangled representations for associating invariant and variant ST contexts. Then, we use representative ST contexts from three conceptually different perspectives (i.e., temporal, spatial, and semantic) as self-supervised signals to inject context information into both representations. In this way, we improve the generalization ability of the learned context-oriented representations to OOD ST traffic forecasting. Comprehensive experiments on four large-scale benchmark datasets demonstrate that our STEVE consistently outperforms the state-of-the-art baselines across various ST OOD scenarios.

arxiv情報

著者 Jiahao Ji,Wentao Zhang,Jingyuan Wang,Yue He,Chao Huang
発行日 2024-03-06 12:57:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク