GSGFormer: Generative Social Graph Transformer for Multimodal Pedestrian Trajectory Prediction

要約

自動運転車や社会認識型ロボットにとって不可欠な歩行者の軌道予測は、歩行者、その環境、その他の交通弱者との間の複雑な相互作用により複雑になります。
この論文では、これらの複雑な相互作用を考慮し、潜在的なモーダル動作を多数提供することで歩行者の軌跡を予測することに優れた革新的な生成モデルである GSGFormer について紹介します。
異種グラフ ニューラル ネットワークを組み込んで、歩行者、セマンティック マップ、および潜在的な目的地の間のインタラクションをキャプチャします。
Transformer モジュールは時間的特徴を抽出し、新しい CVAE-Residual-GMM モジュールは多様な行動モダリティの生成を促進します。
複数の公開データセットの評価を通じて、GSGFormer は豊富なデータで主要な手法を上回るパフォーマンスを発揮するだけでなく、データが限られている場合でも競争力を維持します。

要約(オリジナル)

Pedestrian trajectory prediction, vital for selfdriving cars and socially-aware robots, is complicated due to intricate interactions between pedestrians, their environment, and other Vulnerable Road Users. This paper presents GSGFormer, an innovative generative model adept at predicting pedestrian trajectories by considering these complex interactions and offering a plethora of potential modal behaviors. We incorporate a heterogeneous graph neural network to capture interactions between pedestrians, semantic maps, and potential destinations. The Transformer module extracts temporal features, while our novel CVAE-Residual-GMM module promotes diverse behavioral modality generation. Through evaluations on multiple public datasets, GSGFormer not only outperforms leading methods with ample data but also remains competitive when data is limited.

arxiv情報

著者 Zhongchang Luo,Marion Robin,Pavan Vasishta
発行日 2023-12-07 17:53:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク