MapTRv2: An End-to-End Framework for Online Vectorized HD Map Construction


高解像度 (HD) マップは、走行シーンの静的な環境情報を豊富かつ正確に提供し、自動運転システムの計画に不可欠な基本的なコンポーネントとして機能します。
このペーパーでは、オンラインでベクトル化された HD マップを構築するためのエンドツーエンドのフレームワークである \textbf{Map} \textbf{TR}ansformer を紹介します。
収束を高速化するために、補助的な 1 対多のマッチングと高密度監視をさらに導入します。
リアルタイムの推論速度で実行され、nuScenes と Argoverse2 データセットの両方で最先端のパフォーマンスを実現します。
さらなる研究や応用を容易にするために、コードやその他のデモが \url{} で入手できます。


High-definition (HD) map provides abundant and precise static environmental information of the driving scene, serving as a fundamental and indispensable component for planning in autonomous driving system. In this paper, we present \textbf{Map} \textbf{TR}ansformer, an end-to-end framework for online vectorized HD map construction. We propose a unified permutation-equivalent modeling approach, \ie, modeling map element as a point set with a group of equivalent permutations, which accurately describes the shape of map element and stabilizes the learning process. We design a hierarchical query embedding scheme to flexibly encode structured map information and perform hierarchical bipartite matching for map element learning. To speed up convergence, we further introduce auxiliary one-to-many matching and dense supervision. The proposed method well copes with various map elements with arbitrary shapes. It runs at real-time inference speed and achieves state-of-the-art performance on both nuScenes and Argoverse2 datasets. Abundant qualitative results show stable and robust map construction quality in complex and various driving scenes. Code and more demos are available at \url{} for facilitating further studies and applications.


著者 Bencheng Liao,Shaoyu Chen,Yunchi Zhang,Bo Jiang,Qian Zhang,Wenyu Liu,Chang Huang,Xinggang Wang
発行日 2023-08-10 17:56:53+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CV, cs.RO パーマリンク