RelTopo: Enhancing Relational Modeling for Driving Scene Topology Reasoning

要約

正確な道路トポロジの推論は、自律的な運転にとって重要であり、効果的なナビゲーションと交通規制の順守を可能にします。
このタスクの中心は、車線認識とトポロジーの推論です。
ただし、既存の方法は通常、レーン検出またはレーン間(L2L)トポロジーの推論のいずれかに焦点を当てています。多くの場合、\ textit {無視}レーンとトラフィックエレメント(L2T)関係または\ textIT {失敗}これらのタスクを共同で最適化します。
さらに、ほとんどのアプローチは、道路要素間の固有の空間的関係にもかかわらず、リレーショナルモデリングを見落とすか、限られた範囲で適用します。
人間は道路要素認識とその接続性推論のために自然に文脈関係を活用するため、リレーショナルモデリングは知覚と推論の両方に有益であると主張します。
この目的のために、知覚と推論の両方にリレーショナルモデリングを導入します。
具体的には、次の提案を提案します。1)リレーショナル依存関係をキャプチャすることにより、幾何学的に偏った自己触たちと\ curve \ cross-attention \ cross-attentionを洗練する関係を認識するレーン検出器。
2)形状強化L2LヘッドとクロスビューL2Tヘッドを含む関係強化トポロジヘッドは、リレーショナルキューで推論を強化します。
3)関係の埋め込みを正規化するためのInfonceの損失を伴う対照的な学習戦略。
OpenLane-V2の広範な実験は、私たちのアプローチが検出とトポロジの推論メトリックの両方を大幅に改善し、Det $ _L $で+3.1を達成することを示しています。
コードがリリースされます。

要約(オリジナル)

Accurate road topology reasoning is critical for autonomous driving, enabling effective navigation and adherence to traffic regulations. Central to this task are lane perception and topology reasoning. However, existing methods typically focus on either lane detection or Lane-to-Lane (L2L) topology reasoning, often \textit{neglecting} Lane-to-Traffic-element (L2T) relationships or \textit{failing} to optimize these tasks jointly. Furthermore, most approaches either overlook relational modeling or apply it in a limited scope, despite the inherent spatial relationships among road elements. We argue that relational modeling is beneficial for both perception and reasoning, as humans naturally leverage contextual relationships for road element recognition and their connectivity inference. To this end, we introduce relational modeling into both perception and reasoning, \textit{jointly} enhancing structural understanding. Specifically, we propose: 1) a relation-aware lane detector, where our geometry-biased self-attention and \curve\ cross-attention refine lane representations by capturing relational dependencies; 2) relation-enhanced topology heads, including a geometry-enhanced L2L head and a cross-view L2T head, boosting reasoning with relational cues; and 3) a contrastive learning strategy with InfoNCE loss to regularize relationship embeddings. Extensive experiments on OpenLane-V2 demonstrate that our approach significantly improves both detection and topology reasoning metrics, achieving +3.1 in DET$_l$, +5.3 in TOP$_{ll}$, +4.9 in TOP$_{lt}$, and an overall +4.4 in OLS, setting a new state-of-the-art. Code will be released.

arxiv情報

著者 Yueru Luo,Changqing Zhou,Yiming Yang,Erlong Li,Chao Zheng,Shuqi Mei,Shuguang Cui,Zhen Li
発行日 2025-06-16 14:40:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク