PriorMapNet: Enhancing Online Vectorized HD Map Construction with Priors

要約

オンラインでベクトル化された高精細 (HD) マップの構築は、自動運転における後続の予測および計画タスクに不可欠です。
MapTR パラダイムに従って、最近の研究は注目に値する成果を上げています。
ただし、主流の方法では参照点がランダムに初期化されるため、予測とグランド トゥルース間のマッチングが不安定になります。
この問題に対処するために、事前分布を使用したオンライン ベクトル化 HD マップ構築を強化する PriorMapNet を導入します。
我々は、位置と構造の事前分布を持つ参照点を提供する PPS デコーダを提案します。
データセット内のマップ要素からフィッティングされた事前の参照ポイントにより、学習の難易度が低下し、安定したマッチングが実現されます。
さらに、BEV 特徴事前分布を使用して画像から BEV への変換を強化する PF エンコーダを提案します。
さらに、効率を達成するためにマルチスケールとマルチサンプルに沿ってクロスアテンションをそれぞれ分離する DMD クロスアテンションを提案します。
私たちが提案する PriorMapNet は、nuScenes および Argoverse2 データセット上のオンライン ベクトル化 HD マップ構築タスクにおいて最先端のパフォーマンスを実現します。
コードは近々公開される予定です。

要約(オリジナル)

Online vectorized High-Definition (HD) map construction is crucial for subsequent prediction and planning tasks in autonomous driving. Following MapTR paradigm, recent works have made noteworthy achievements. However, reference points are randomly initialized in mainstream methods, leading to unstable matching between predictions and ground truth. To address this issue, we introduce PriorMapNet to enhance online vectorized HD map construction with priors. We propose the PPS-Decoder, which provides reference points with position and structure priors. Fitted from the map elements in the dataset, prior reference points lower the learning difficulty and achieve stable matching. Furthermore, we propose the PF-Encoder to enhance the image-to-BEV transformation with BEV feature priors. Besides, we propose the DMD cross-attention, which decouples cross-attention along multi-scale and multi-sample respectively to achieve efficiency. Our proposed PriorMapNet achieves state-of-the-art performance in the online vectorized HD map construction task on nuScenes and Argoverse2 datasets. The code will be released publicly soon.

arxiv情報

著者 Rongxuan Wang,Xin Lu,Xiaoyang Liu,Xiaoyi Zou,Tongyi Cao,Ying Li
発行日 2024-08-16 15:26:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク