要約
周囲のエージェントの軌道を予測することは、依然として自動運転にとって最も困難なタスクの 1 つと考えられています。
この論文では、変圧器ネットワークに基づいたマルチモーダル軌道予測フレームワークを紹介します。
各エージェントのセマンティック マップは、畳み込みネットワークへの入力として使用され、関連するコンテキスト情報が自動的に導出されます。
この研究では、実現不可能なオフロード予測にペナルティを与える新しい補助損失も提案されています。
Lyft l5kit データセットの実験では、提案されたモデルが最先端のパフォーマンスを達成し、予測結果の精度と実現可能性が大幅に向上していることが示されています。
要約(オリジナル)
Predicting the trajectories of surrounding agents is still considered one of the most challenging tasks for autonomous driving. In this paper, we introduce a multi-modal trajectory prediction framework based on the transformer network. The semantic maps of each agent are used as inputs to convolutional networks to automatically derive relevant contextual information. A novel auxiliary loss that penalizes unfeasible off-road predictions is also proposed in this study. Experiments on the Lyft l5kit dataset show that the proposed model achieves state-of-the-art performance, substantially improving the accuracy and feasibility of the prediction outcomes.
arxiv情報
著者 | Zhenning Li,Hao Yu |
発行日 | 2024-02-26 11:35:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google