要約
交通安全や自動運転には、走行シーンを正確に予測することが不可欠です。
占有グリッド マップ (OGM) は、構造化された空間表現、センサー モダリティ全体の柔軟性、および不確実性の統合により、シーン予測に一般的に使用されます。
最近の研究では、OGM と深層学習手法を組み合わせて、シーンの展開を予測し、複雑な動作を学習することに成功しました。
ただし、これらの方法では、シーン内の流れベクトルまたは速度ベクトルの予測は考慮されていません。
この研究では、動的な OGM とセマンティック情報を活用して、将来の車両セマンティック グリッドとシーンの将来の流れの両方を予測する、新しいマルチタスク フレームワークを提案します。
このセマンティック フローの組み込みにより、中間シーンの機能が提供されるだけでなく、ワープされたセマンティック グリッドの生成も可能になります。
現実世界の NuScenes データセットの評価では、予測機能の向上と、シーン内に動的車両を保持するモデルの機能の強化が実証されています。
要約(オリジナル)
Accurate prediction of driving scenes is essential for road safety and autonomous driving. Occupancy Grid Maps (OGMs) are commonly employed for scene prediction due to their structured spatial representation, flexibility across sensor modalities and integration of uncertainty. Recent studies have successfully combined OGMs with deep learning methods to predict the evolution of scene and learn complex behaviours. These methods, however, do not consider prediction of flow or velocity vectors in the scene. In this work, we propose a novel multi-task framework that leverages dynamic OGMs and semantic information to predict both future vehicle semantic grids and the future flow of the scene. This incorporation of semantic flow not only offers intermediate scene features but also enables the generation of warped semantic grids. Evaluation on the real-world NuScenes dataset demonstrates improved prediction capabilities and enhanced ability of the model to retain dynamic vehicles within the scene.
arxiv情報
著者 | Rabbia Asghar,Wenqian Liu,Lukas Rummelhard,Anne Spalanzani,Christian Laugier |
発行日 | 2024-07-22 14:42:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google