TopoLogic: An Interpretable Pipeline for Lane Topology Reasoning on Driving Scenes

要約

自動運転シーンにおけるトポロジー推論は、知覚と推論を統合する新たなタスクとして、最近広く注目を集めています。
ただし、既存の研究では「推論よりも知覚」が強調されることが多く、通常、レーンの認識を強化することで推論のパフォーマンスが向上し、MLP を直接採用してレーン クエリからレーン トポロジを学習します。
このパラダイムは、車線自体に固有の幾何学的特徴を見落としており、車線検出における固有のエンドポイントのシフトの影響を受ける傾向があります。
この問題に取り組むために、我々は、車線の幾何学的距離と車線クエリの類似性に基づいて車線トポロジを推論する、TopoLogic という解釈可能な方法を提案します。
この方法は、幾何学的空間でのエンドポイントのシフトの影響を軽減し、補完として意味論的空間での明示的な類似性計算を導入します。
両方の空間からの結果を統合することにより、私たちの方法は、レーン トポロジに関するより包括的な情報を提供します。
最終的に、私たちのアプローチは、主流のベンチマークである OpenLane-V2 で既存の最先端の手法を大幅に上回ります (サブセット_A の TOP$_{ll}$ では 23.9 対 10.9、OLS では 44.1 対 39.8)。さらに、私たちが提案した幾何学的距離
トポロジ推論手法は、再トレーニングせずに十分にトレーニングされたモデルに組み込むことができ、レーン トポロジ推論のパフォーマンスが大幅に向上します。コードは https://github.com/Franpin/TopoLogic でリリースされています。

要約(オリジナル)

As an emerging task that integrates perception and reasoning, topology reasoning in autonomous driving scenes has recently garnered widespread attention. However, existing work often emphasizes ‘perception over reasoning’: they typically boost reasoning performance by enhancing the perception of lanes and directly adopt MLP to learn lane topology from lane query. This paradigm overlooks the geometric features intrinsic to the lanes themselves and are prone to being influenced by inherent endpoint shifts in lane detection. To tackle this issue, we propose an interpretable method for lane topology reasoning based on lane geometric distance and lane query similarity, named TopoLogic. This method mitigates the impact of endpoint shifts in geometric space, and introduces explicit similarity calculation in semantic space as a complement. By integrating results from both spaces, our methods provides more comprehensive information for lane topology. Ultimately, our approach significantly outperforms the existing state-of-the-art methods on the mainstream benchmark OpenLane-V2 (23.9 v.s. 10.9 in TOP$_{ll}$ and 44.1 v.s. 39.8 in OLS on subset_A. Additionally, our proposed geometric distance topology reasoning method can be incorporated into well-trained models without re-training, significantly boost the performance of lane topology reasoning. The code is released at https://github.com/Franpin/TopoLogic.

arxiv情報

著者 Yanping Fu,Wenbin Liao,Xinyuan Liu,Hang xu,Yike Ma,Feng Dai,Yucheng Zhang
発行日 2024-05-23 16:15:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク