DESTINE: Dynamic Goal Queries with Temporal Transductive Alignment for Trajectory Prediction

要約

マルチエージェント環境で時間的に一貫した道路利用者の軌跡を予測することは、エージェントの未知の特性とエージェントのさまざまな意図のため、困難な作業です。
セマンティック マップ情報の使用と対話のモデリングに加えて、さまざまな粒度レベルで動作を推論できる効果的なメカニズムを構築することが重要です。
この目的を達成するために、我々は時間的伝達的調整(DESTINE)法を用いた動的目標クエリを提案する。
過去の技術とは異なり、私たちのアプローチは 1) 車線などの特定の道路構造に関係なくエージェントの目標を動的に予測し、目的地のより正確な推定を行う方法を可能にします。
2) 粗いものから細かいものへの方法で将来の軌道を生成することによってマップに準拠した予測を達成します。低いフレーム レートでのより粗い予測が中間目標として機能します。
3) マスクされた注意を介して予測された軌道を時間的に調整するように設計された注意モジュールを使用します。
共通の Argoverse ベンチマーク データセットを使用して、私たちの手法がさまざまな指標で最先端のパフォーマンスを達成していることを示し、包括的なアブレーション研究を通じて提案されたモジュールの貢献をさらに調査します。

要約(オリジナル)

Predicting temporally consistent road users’ trajectories in a multi-agent setting is a challenging task due to unknown characteristics of agents and their varying intentions. Besides using semantic map information and modeling interactions, it is important to build an effective mechanism capable of reasoning about behaviors at different levels of granularity. To this end, we propose Dynamic goal quErieS with temporal Transductive alIgNmEnt (DESTINE) method. Unlike past arts, our approach 1) dynamically predicts agents’ goals irrespective of particular road structures, such as lanes, allowing the method to produce a more accurate estimation of destinations; 2) achieves map compliant predictions by generating future trajectories in a coarse-to-fine fashion, where the coarser predictions at a lower frame rate serve as intermediate goals; and 3) uses an attention module designed to temporally align predicted trajectories via masked attention. Using the common Argoverse benchmark dataset, we show that our method achieves state-of-the-art performance on various metrics, and further investigate the contributions of proposed modules via comprehensive ablation studies.

arxiv情報

著者 Rezaul Karim,Soheil Mohamad Alizadeh Shabestary,Amir Rasouli
発行日 2023-10-11 12:41:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク