FastMap: Fast Queries Initialization Based Vectorized HD Map Reconstruction Framework

要約

高解像度マップの再構築は、自律運転環境を知覚する上で重要なタスクです。その精度は、下流モジュールの予測能力と計画機能の信頼性に直接影響するためです。
DETRフレームワークに基づく現在のベクトル化されたマップ再構成方法は、デコーダー構造の冗長性による制限があり、パフォーマンスを維持するために6つのデコーダー層の積み重ねを必要とし、計算効率を大幅に妨げます。
この問題に取り組むために、既存のアプローチでのデコーダー冗長性を減らすために設計された革新的なフレームワークであるFastMapを紹介します。
FastMapは、マルチレベル表現機能を実現する単一層の2段階変圧器を使用することにより、デコーダーアーキテクチャを最適化します。
私たちのフレームワークは、ランダムにクエリを初期化する従来の慣行を排除し、代わりにデコードフェーズ中にヒートマップ誘導クエリ生成モジュールを組み込みます。
さらに、FastMapの幾何学的に制約されたポイントツーライン損失メカニズムを提案します。これは、従来のポイントツーポイント損失計算でしばしば発生する非常に均質な特徴を区別するという課題に慣れています。
広範な実験は、FastMapがヌスセンとArgoverse2データセットの両方で最先端のパフォーマンスを達成し、デコーダーがベースラインよりも3.2速で動作することを示しています。
コードとその他のデモは、https://github.com/hht1996ok/fastmapで入手できます。

要約(オリジナル)

Reconstruction of high-definition maps is a crucial task in perceiving the autonomous driving environment, as its accuracy directly impacts the reliability of prediction and planning capabilities in downstream modules. Current vectorized map reconstruction methods based on the DETR framework encounter limitations due to the redundancy in the decoder structure, necessitating the stacking of six decoder layers to maintain performance, which significantly hampers computational efficiency. To tackle this issue, we introduce FastMap, an innovative framework designed to reduce decoder redundancy in existing approaches. FastMap optimizes the decoder architecture by employing a single-layer, two-stage transformer that achieves multilevel representation capabilities. Our framework eliminates the conventional practice of randomly initializing queries and instead incorporates a heatmap-guided query generation module during the decoding phase, which effectively maps image features into structured query vectors using learnable positional encoding. Additionally, we propose a geometry-constrained point-to-line loss mechanism for FastMap, which adeptly addresses the challenge of distinguishing highly homogeneous features that often arise in traditional point-to-point loss computations. Extensive experiments demonstrate that FastMap achieves state-of-the-art performance in both nuScenes and Argoverse2 datasets, with its decoder operating 3.2 faster than the baseline. Code and more demos are available at https://github.com/hht1996ok/FastMap.

arxiv情報

著者 Haotian Hu,Jingwei Xu,Fanyi Wang,Toyota Li,Yaonong Wang,Laifeng Hu,Zhiwang Zhang
発行日 2025-03-07 15:01:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク