要約
人間のステアリング動作をリアルタイムで正確に予測することは、インテリジェントな交通システムの開発から、現実の世界とシミュレートされた世界の両方での自動運転システムの展開まで、幅広い用途があります。
このホワイトペーパーでは、マルチモーダル車両軌道予測のためのコンテキスト認識型アプローチである ContextVAE を紹介します。
時間ごとの変分オートエンコーダーのバックボーン アーキテクチャに基づいて構築された ContextVAE は、環境コンテキスト情報と動的エージェントの状態を統一された方法で説明する観測エンコーディングにデュアル アテンション メカニズムを採用しています。
エージェント状態のエンコーディング中にセマンティック マップから抽出された機能を利用することにより、私たちのアプローチは、シーン上のエージェントによって示される社会的特徴と物理的環境の制約の両方を考慮して、マップに準拠した社会的認識の軌跡を生成します。
nuScenes 予測チャレンジ、Lyft レベル 5 データセット、Waymo Open Motion データセットで広範なテストを実施し、アプローチの有効性と最先端のパフォーマンスを示します。
テストされたすべてのデータセットで、ContextVAE モデルはトレーニングが高速で、高品質のマルチモーダル予測をリアルタイムで提供します。
要約(オリジナル)
Real-time, accurate prediction of human steering behaviors has wide applications, from developing intelligent traffic systems to deploying autonomous driving systems in both real and simulated worlds. In this paper, we present ContextVAE, a context-aware approach for multi-modal vehicle trajectory prediction. Built upon the backbone architecture of a timewise variational autoencoder, ContextVAE employs a dual attention mechanism for observation encoding that accounts for the environmental context information and the dynamic agents’ states in a unified way. By utilizing features extracted from semantic maps during agent state encoding, our approach takes into account both the social features exhibited by agents on the scene and the physical environment constraints to generate map-compliant and socially-aware trajectories. We perform extensive testing on the nuScenes prediction challenge, Lyft Level 5 dataset and Waymo Open Motion Dataset to show the effectiveness of our approach and its state-of-the-art performance. In all tested datasets, ContextVAE models are fast to train and provide high-quality multi-modal predictions in real-time.
arxiv情報
著者 | Pei Xu,Jean-Bernard Hayet,Ioannis Karamouzas |
発行日 | 2023-02-21 18:42:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google