TopoLogic: An Interpretable Pipeline for Lane Topology Reasoning on Driving Scenes


ただし、既存の研究では「推論よりも知覚」が強調されることが多く、通常、レーンの認識を強化することで推論のパフォーマンスが向上し、MLP を直接採用してレーン クエリからレーン トポロジを学習します。
この問題に取り組むために、我々は、車線の幾何学的距離と車線クエリの類似性に基づいて車線トポロジを推論する、TopoLogic という解釈可能な方法を提案します。
両方の空間からの結果を統合することにより、私たちの方法は、レーン トポロジに関するより包括的な情報を提供します。
最終的に、私たちのアプローチは、主流のベンチマークである OpenLane-V2 で既存の最先端の手法を大幅に上回ります (サブセット_A の TOP$_{ll}$ では 23.9 対 10.9、OLS では 44.1 対 39.8)。さらに、私たちが提案した幾何学的距離
トポロジ推論手法は、再トレーニングせずに十分にトレーニングされたモデルに組み込むことができ、レーン トポロジ推論のパフォーマンスが大幅に向上します。コードは でリリースされています。


As an emerging task that integrates perception and reasoning, topology reasoning in autonomous driving scenes has recently garnered widespread attention. However, existing work often emphasizes ‘perception over reasoning’: they typically boost reasoning performance by enhancing the perception of lanes and directly adopt MLP to learn lane topology from lane query. This paradigm overlooks the geometric features intrinsic to the lanes themselves and are prone to being influenced by inherent endpoint shifts in lane detection. To tackle this issue, we propose an interpretable method for lane topology reasoning based on lane geometric distance and lane query similarity, named TopoLogic. This method mitigates the impact of endpoint shifts in geometric space, and introduces explicit similarity calculation in semantic space as a complement. By integrating results from both spaces, our methods provides more comprehensive information for lane topology. Ultimately, our approach significantly outperforms the existing state-of-the-art methods on the mainstream benchmark OpenLane-V2 (23.9 v.s. 10.9 in TOP$_{ll}$ and 44.1 v.s. 39.8 in OLS on subset_A. Additionally, our proposed geometric distance topology reasoning method can be incorporated into well-trained models without re-training, significantly boost the performance of lane topology reasoning. The code is released at


著者 Yanping Fu,Wenbin Liao,Xinyuan Liu,Hang xu,Yike Ma,Feng Dai,Yucheng Zhang
発行日 2024-05-23 16:15:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CV パーマリンク