A Sparse Cross Attention-based Graph Convolution Network with Auxiliary Information Awareness for Traffic Flow Prediction

要約

ディープ グラフ畳み込みネットワーク (GCN) は最近、トラフィック予測タスクにおいて優れたパフォーマンスを示しています。
ただし、いくつかの課題に直面しています。
第一に、既存のモデルは天候や休日などの補助情報の影響を考慮しているものがほとんどないため、交通データの時空間ダイナミクスの把握が不十分になる可能性があります。
第 2 に、動的隣接行列の構築と通常のグラフ畳み込み演算の両方に二次計算の複雑さがあり、GCN ベースのモデルのスケーラビリティが制限されます。
このような課題に対処するために、この研究では、AIMSAN という名前のディープ エンコーダ/デコーダ モデルを提案しています。
これには、補助情報認識モジュール (AIM) とスパース クロス アテンション ベースのグラフ畳み込みネットワーク (SAN) が含まれています。
前者は、複数の属性の補助情報を学習し、さまざまなタイム ウィンドウ サイズの埋め込まれたプレゼンテーションを取得します。
後者は、クロスアテンション メカニズムを使用して、トラフィック データと埋め込まれた補助データを融合することによって動的隣接行列を構築します。
次に、SAN はトラフィック データに拡散 GCN を適用して、豊富な時空間ダイナミクスをマイニングします。
さらに、AIMSAN は、トラフィック ノードの空間的疎性を考慮して使用し、二次計算の複雑さを軽減します。
3 つの公共交通データセットに関する実験結果は、提案された方法がさまざまなパフォーマンス指標の点で他の対応する方法よりも優れていることを示しています。
具体的には、提案された方法は、最先端のアルゴリズムと競合するパフォーマンスを持ちながら、平均で GPU メモリ使用量の 35.74%、トレーニング時間の 42.25%、検証時間の 45.51% を節約します。

要約(オリジナル)

Deep graph convolution networks (GCNs) have recently shown excellent performance in traffic prediction tasks. However, they face some challenges. First, few existing models consider the influence of auxiliary information, i.e., weather and holidays, which may result in a poor grasp of spatial-temporal dynamics of traffic data. Second, both the construction of a dynamic adjacent matrix and regular graph convolution operations have quadratic computation complexity, which restricts the scalability of GCN-based models. To address such challenges, this work proposes a deep encoder-decoder model entitled AIMSAN. It contains an auxiliary information-aware module (AIM) and sparse cross attention-based graph convolution network (SAN). The former learns multi-attribute auxiliary information and obtains its embedded presentation of different time-window sizes. The latter uses a cross-attention mechanism to construct dynamic adjacent matrices by fusing traffic data and embedded auxiliary data. Then, SAN applies diffusion GCN on traffic data to mine rich spatial-temporal dynamics. Furthermore, AIMSAN considers and uses the spatial sparseness of traffic nodes to reduce the quadratic computation complexity. Experimental results on three public traffic datasets demonstrate that the proposed method outperforms other counterparts in terms of various performance indices. Specifically, the proposed method has competitive performance with the state-of-the-art algorithms but saves 35.74% of GPU memory usage, 42.25% of training time, and 45.51% of validation time on average.

arxiv情報

著者 Lingqiang Chen,Qinglin Zhao,Guanghui Li,Mengchu Zhou,Chenglong Dai,Yiming Feng
発行日 2023-12-14 15:48:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク