ScalableMap: Scalable Map Learning for Online Long-Range Vectorized HD Map Construction

要約

私たちは、オンボード カメラ センサーを使用したオンライン長距離ベクトル化高精細 (HD) マップ構築のための新しいエンドツーエンド パイプラインを提案します。
ポリラインとポリゴンを使用してマップ要素を表現する HD マップのベクトル化表現は、下流のタスクで広く使用されています。
ただし、動的物体検出を参照して設計された以前のスキームは、線形マップ要素内の構造的制約を見落としており、長距離シナリオではパフォーマンスが低下します。
この論文では、マップ要素のプロパティを利用してマップ構築のパフォーマンスを向上させます。
線形構造に基づいてより正確な鳥瞰図 (BEV) 特徴を抽出し、ベクトル化された地図要素のスケーラビリティをさらに活用するための階層的疎地図表現を提案し、この表現に基づいてプログレッシブ デコード メカニズムと監視戦略を設計します。
私たちのアプローチである ScalableMap は、nuScenes データセット上で、特に長距離シナリオにおいて優れたパフォーマンスを示し、18.3 FPS を達成しながら、以前の最先端モデルを 6.5 mAP 上回りました。
コードは https://github.com/jingy1yu/ScalableMap で入手できます。

要約(オリジナル)

We propose a novel end-to-end pipeline for online long-range vectorized high-definition (HD) map construction using on-board camera sensors. The vectorized representation of HD maps, employing polylines and polygons to represent map elements, is widely used by downstream tasks. However, previous schemes designed with reference to dynamic object detection overlook the structural constraints within linear map elements, resulting in performance degradation in long-range scenarios. In this paper, we exploit the properties of map elements to improve the performance of map construction. We extract more accurate bird’s eye view (BEV) features guided by their linear structure, and then propose a hierarchical sparse map representation to further leverage the scalability of vectorized map elements and design a progressive decoding mechanism and a supervision strategy based on this representation. Our approach, ScalableMap, demonstrates superior performance on the nuScenes dataset, especially in long-range scenarios, surpassing previous state-of-the-art model by 6.5 mAP while achieving 18.3 FPS. Code is available at https://github.com/jingy1yu/ScalableMap.

arxiv情報

著者 Jingyi Yu,Zizhao Zhang,Shengfu Xia,Jizhang Sang
発行日 2023-10-20 09:46:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク