要約
自動運転システムの最近の進歩は、アノテーションとメンテナンスに莫大なコストがかかるため、高精細地図 (HDMap) への依存を減らす方向に移行しています。
代わりに、研究者らはオンボードセンサーを使用したオンラインのベクトル化された HDMap 構築に焦点を当てています。
しかし、人間のドライバーも道路構造を包括的に理解するために鳥瞰図ナビゲーション マップに依存しているのと同様に、センサーのみのアプローチでは、車載カメラの取り付け角度によってビューが制限されるため、長距離の知覚において依然として課題に直面しています。
これらの問題に対処するために、標準定義マップ (SDMaps) を「見る」ように知覚モデルをトレーニングすることを提案します。
SDMap 要素をニューラル空間マップ表現とインスタンス トークンにエンコードし、そのような補完的な機能を事前情報として組み込んで、レーン ジオメトリとトポロジ デコードのための鳥瞰図 (BEV) 機能を改善します。
車線セグメント表現フレームワークに基づいて、モデルは車線、センターライン、およびそれらのトポロジを同時に予測します。
ジオメトリ予測とトポロジ推論の能力をさらに強化するために、トポロジガイド型デコーダを使用して、トポロジと幾何学的特徴の間の相互関係を利用して予測を改良します。
提案された方法を検証するために、OpenLane-V2 データセットに対して広範な実験を実行します。
結果は、私たちのモデルが最先端の手法を大幅に上回り、mAP およびトポロジ メトリックで +6.7 および +9.1 のゲインが得られたことを示しています。
私たちの分析では、SDMap ノイズ拡張でトレーニングされたモデルが強化された堅牢性を示していることも明らかになりました。
要約(オリジナル)
Recent advances in autonomous driving systems have shifted towards reducing reliance on high-definition maps (HDMaps) due to the huge costs of annotation and maintenance. Instead, researchers are focusing on online vectorized HDMap construction using on-board sensors. However, sensor-only approaches still face challenges in long-range perception due to the restricted views imposed by the mounting angles of onboard cameras, just as human drivers also rely on bird’s-eye-view navigation maps for a comprehensive understanding of road structures. To address these issues, we propose to train the perception model to ‘see’ standard definition maps (SDMaps). We encode SDMap elements into neural spatial map representations and instance tokens, and then incorporate such complementary features as prior information to improve the bird’s eye view (BEV) feature for lane geometry and topology decoding. Based on the lane segment representation framework, the model simultaneously predicts lanes, centrelines and their topology. To further enhance the ability of geometry prediction and topology reasoning, we also use a topology-guided decoder to refine the predictions by exploiting the mutual relationships between topological and geometric features. We perform extensive experiments on OpenLane-V2 datasets to validate the proposed method. The results show that our model outperforms state-of-the-art methods by a large margin, with gains of +6.7 and +9.1 on the mAP and topology metrics. Our analysis also reveals that models trained with SDMap noise augmentation exhibit enhanced robustness.
arxiv情報
著者 | Sen Yang,Minyue Jiang,Ziwei Fan,Xiaolu Xie,Xiao Tan,Yingying Li,Errui Ding,Liang Wang,Jingdong Wang |
発行日 | 2024-11-22 06:13:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google