Spatio-Temporal Contrastive Self-Supervised Learning for POI-level Crowd Flow Inference

要約

興味のある地点 (POI) での群衆の流れを正確に取得することは、効果的な交通管理、公共サービス、都市計画にとって極めて重要です。
この重要性にもかかわらず、都市センシング技術の限界により、ほとんどのソースからのデータ品質は各POIでの群衆の流れを監視するには不十分です。
そのため、低品質のデータから正確な群衆の流れを推測することが重要かつ困難なタスクになります。
この複雑さは、1) ラベル付きデータの希少性と稀少性、2) POI 間の複雑な時空間依存関係、3) 正確な群衆の流れと GPS レポートの間の無数の相関関係という 3 つの重要な要因によってさらに高まります。
これらの課題に対処するために、群衆の流れ推論問題を自己教師付き属性グラフ表現学習タスクとして再構築し、時空間データ (CSST) 用の新しい対照的自己学習フレームワークを導入します。
私たちのアプローチは、POI とそれぞれの距離に基づいた空間隣接グラフの構築から始まります。
次に、対照学習手法を使用して、ラベルのない大量の時空間データを活用します。
スワップ予測アプローチを採用して、類似したインスタンスからターゲットのサブグラフの表現を予測します。
事前トレーニング段階に続いて、モデルは正確な群衆の流れデータを使用して微調整されます。
2 つの現実世界のデータセットに対して行われた実験では、広範なノイズを含むデータで事前トレーニングされた CSST が、ゼロからトレーニングされたモデルよりも一貫して優れていることが実証されました。

要約(オリジナル)

Accurate acquisition of crowd flow at Points of Interest (POIs) is pivotal for effective traffic management, public service, and urban planning. Despite this importance, due to the limitations of urban sensing techniques, the data quality from most sources is inadequate for monitoring crowd flow at each POI. This renders the inference of accurate crowd flow from low-quality data a critical and challenging task. The complexity is heightened by three key factors: 1) The scarcity and rarity of labeled data, 2) The intricate spatio-temporal dependencies among POIs, and 3) The myriad correlations between precise crowd flow and GPS reports. To address these challenges, we recast the crowd flow inference problem as a self-supervised attributed graph representation learning task and introduce a novel Contrastive Self-learning framework for Spatio-Temporal data (CSST). Our approach initiates with the construction of a spatial adjacency graph founded on the POIs and their respective distances. We then employ a contrastive learning technique to exploit large volumes of unlabeled spatio-temporal data. We adopt a swapped prediction approach to anticipate the representation of the target subgraph from similar instances. Following the pre-training phase, the model is fine-tuned with accurate crowd flow data. Our experiments, conducted on two real-world datasets, demonstrate that the CSST pre-trained on extensive noisy data consistently outperforms models trained from scratch.

arxiv情報

著者 Songyu Ke,Ting Li,Li Song,Yanping Sun,Qintian Sun,Junbo Zhang,Yu Zheng
発行日 2023-09-12 10:19:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG, I.2 パーマリンク