PrevPredMap: Exploring Temporal Modeling with Previous Predictions for Online Vectorized HD Map Construction

要約

時間情報は、遮蔽されたインスタンスを検出するために重要です。
既存の時間表現は、BEV または PV 機能から、よりコンパクトなクエリ機能に進化しました。
これらの前述の機能と比較して、予測は最高レベルの抽象化を提供し、明示的な情報を提供します。
オンラインでベクトル化された HD マップ構築のコンテキストでは、予測のこのユニークな特性は、長期的な時間モデリングと事前マップの統合に潜在的に有利です。
このペーパーでは、オンラインのベクトル化された HD マップを構築するために以前の予測を活用する先駆的な時間モデリング フレームワークである PrevPredMap を紹介します。
私たちは、PrevPredMap に不可欠な 2 つのモジュール、以前の予測ベースのクエリ ジェネレーターと動的位置クエリ デコーダーを細心の注意を払って作成しました。
具体的には、以前の予測ベースのクエリ ジェネレーターは、以前の予測からさまざまな種類の情報を個別にエンコードするように設計されており、これらの情報は動的位置クエリ デコーダーによって現在の予測を生成するために効果的に利用されます。
さらに、シングル フレーム モードと時間モードの両方で PrevPredMap の堅牢なパフォーマンスを保証するデュアルモード戦略を開発しました。
広範な実験により、PrevPredMap が nuScenes および Argoverse2 データセットで最先端のパフォーマンスを達成することが実証されました。
コードは https://github.com/pnnnnnnn/PrevPredMap で入手できます。

要約(オリジナル)

Temporal information is crucial for detecting occluded instances. Existing temporal representations have progressed from BEV or PV features to more compact query features. Compared to these aforementioned features, predictions offer the highest level of abstraction, providing explicit information. In the context of online vectorized HD map construction, this unique characteristic of predictions is potentially advantageous for long-term temporal modeling and the integration of map priors. This paper introduces PrevPredMap, a pioneering temporal modeling framework that leverages previous predictions for constructing online vectorized HD maps. We have meticulously crafted two essential modules for PrevPredMap: the previous-predictions-based query generator and the dynamic-position-query decoder. Specifically, the previous-predictions-based query generator is designed to separately encode different types of information from previous predictions, which are then effectively utilized by the dynamic-position-query decoder to generate current predictions. Furthermore, we have developed a dual-mode strategy to ensure PrevPredMap’s robust performance across both single-frame and temporal modes. Extensive experiments demonstrate that PrevPredMap achieves state-of-the-art performance on the nuScenes and Argoverse2 datasets. Code will be available at https://github.com/pnnnnnnn/PrevPredMap.

arxiv情報

著者 Nan Peng,Xun Zhou,Mingming Wang,Xiaojun Yang,Songming Chen,Guisong Chen
発行日 2024-07-24 15:58:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク