要約
自動運転における軌道予測は、交通参加者、道路トポロジ、交通標識、およびそれらの相互の意味的関係を含む、運転シーンの関連するすべてのコンテキストの正確な表現に依存しています。
この問題への注目が高まっているにもかかわらず、軌道予測におけるほとんどのアプローチでは、これらすべての要素が十分に考慮されていません。
この論文では、ハイブリッド アプローチを使用してセマンティックな交通シーン グラフを推論することにより、マルチモーダルな軌跡を予測する SemanticFormer の方法について説明します。
ナレッジ グラフからセマンティック メタパスの形式で高レベルの情報を抽出し、それを複数の注意メカニズムに基づく新しいパイプラインで処理して、正確な軌道を予測します。
提案されたアーキテクチャは、エージェント間およびエージェントと道路要素の間の時空間情報および関係情報をキャプチャできる階層型異種グラフ エンコーダーと、さまざまなエンコーディングを融合して軌道を確率でデコードする予測子で構成されます。
最後に、改良モジュールが軌道と速度プロファイルの許可されたメタパスを評価し、最終的な予測軌道を取得します。
nuScenes ベンチマークを評価すると、最先端の方法と比較してパフォーマンスが向上していることがわかります。
要約(オリジナル)
Trajectory prediction in autonomous driving relies on accurate representation of all relevant contexts of the driving scene including traffic participants, road topology, traffic signs as well as their semantic relations to each other. Despite increased attention to this issue, most approaches in trajectory prediction do not consider all of these factors sufficiently. This paper describes a method SemanticFormer to predict multimodal trajectories by reasoning over a semantic traffic scene graph using a hybrid approach. We extract high-level information in the form of semantic meta-paths from a knowledge graph which is then processed by a novel pipeline based on multiple attention mechanisms to predict accurate trajectories. The proposed architecture comprises a hierarchical heterogeneous graph encoder, which can capture spatio-temporal and relational information across agents and between agents and road elements, and a predictor that fuses the different encodings and decodes trajectories with probabilities. Finally, a refinement module evaluates permitted meta-paths of trajectories and speed profiles to obtain final predicted trajectories. Evaluation of the nuScenes benchmark demonstrates improved performance compared to the state-of-the-art methods.
arxiv情報
著者 | Zhigang Sun,Zixu Wang,Lavdim Halilaj,Juergen Luettin |
発行日 | 2024-04-30 09:11:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google