PMM-Net: Single-stage Multi-agent Trajectory Prediction with Patching-based Embedding and Explicit Modal Modulation

要約

歩行者のようなエージェントの軌跡の分析と予測は、具体化されたインテリジェント アプリケーションにとって極めて重要な役割を果たします。
人間の行動には固有の不確定性と、多種多様なエージェント間の複雑な社会的相互作用により、このタスクは一般的な時系列予測よりも困難になります。
このレターでは、マルチエージェントの軌跡予測フレームワークの明確な定式化を探ることを目的としています。
具体的には、パッチベースの時間的特徴抽出モジュールとグラフベースの社会的特徴抽出モジュールを提案し、効果的な特徴抽出とシナリオ横断的な一般化を可能にしました。
さらに、社会的相互作用の役割を再評価し、時間的特徴と社会的特徴を統合するための明示的なモダリティ変調に基づく新しい方法を提示し、それによって効率的な単一段階の推論パイプラインを構築します。
公開ベンチマーク データセットの結果は、最先端の手法と比較して、当社のモデルのパフォーマンスが優れていることを示しています。
コードは github.com/TIB-K330/pmm-net から入手できます。

要約(オリジナル)

Analyzing and forecasting trajectories of agents like pedestrians plays a pivotal role for embodied intelligent applications. The inherent indeterminacy of human behavior and complex social interaction among a rich variety of agents make this task more challenging than common time-series forecasting. In this letter, we aim to explore a distinct formulation for multi-agent trajectory prediction framework. Specifically, we proposed a patching-based temporal feature extraction module and a graph-based social feature extraction module, enabling effective feature extraction and cross-scenario generalization. Moreover, we reassess the role of social interaction and present a novel method based on explicit modality modulation to integrate temporal and social features, thereby constructing an efficient single-stage inference pipeline. Results on public benchmark datasets demonstrate the superior performance of our model compared with the state-of-the-art methods. The code is available at: github.com/TIB-K330/pmm-net.

arxiv情報

著者 Huajian Liu,Wei Dong,Kunpeng Fan,Chao Wang,Yongzhuo Gao
発行日 2024-10-25 13:16:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.RO パーマリンク