LaneGraph2Seq: Lane Topology Extraction with Language Model via Vertex-Edge Encoding and Connectivity Enhancement

要約

自動運転には道路構造の理解が重要です。
複雑な道路構造は、多くの場合、有向非環状グラフ (DAG) を形成する中心線の曲線と接続を含む車線グラフを使用して描写されます。
レーン グラフを正確に抽出するには、DAG 内の頂点とエッジの情報を正確に推定する必要があります。
最近の研究では、Transformer ベースの言語モデルの優れたシーケンス予測能力が強調されており、グラフ データがシーケンスとしてエンコードされている場合のグラフ表現の学習に効果的です。
ただし、既存の研究は主に頂点を明示的にモデリングすることに焦点を当てており、エッジ情報は単にネットワークに埋め込まれたままになっています。
したがって、これらのアプローチは、レーン グラフ抽出のタスクにおいて不十分です。
これに対処するために、レーン グラフ抽出のための新しいアプローチである LaneGraph2Seq を導入します。
頂点エッジ エンコーディングと接続強化を備えた言語モデルを活用します。
私たちのシリアル化戦略には、頂点中心の深さ優先トラバーサルと簡潔なエッジベースのパーティション シーケンスが含まれています。
さらに、レーンの接続性を向上させるために、核サンプリングと組み合わせた分類子を使用しないガイダンスを使用します。
著名なデータセットである nuScenes と Argoverse 2 でメソッドを検証し、一貫性のある説得力のある結果を示します。
当社の LaneGraph2Seq アプローチは、レーン グラフ抽出における最先端の技術と比較して優れたパフォーマンスを実証します。

要約(オリジナル)

Understanding road structures is crucial for autonomous driving. Intricate road structures are often depicted using lane graphs, which include centerline curves and connections forming a Directed Acyclic Graph (DAG). Accurate extraction of lane graphs relies on precisely estimating vertex and edge information within the DAG. Recent research highlights Transformer-based language models’ impressive sequence prediction abilities, making them effective for learning graph representations when graph data are encoded as sequences. However, existing studies focus mainly on modeling vertices explicitly, leaving edge information simply embedded in the network. Consequently, these approaches fall short in the task of lane graph extraction. To address this, we introduce LaneGraph2Seq, a novel approach for lane graph extraction. It leverages a language model with vertex-edge encoding and connectivity enhancement. Our serialization strategy includes a vertex-centric depth-first traversal and a concise edge-based partition sequence. Additionally, we use classifier-free guidance combined with nucleus sampling to improve lane connectivity. We validate our method on prominent datasets, nuScenes and Argoverse 2, showcasing consistent and compelling results. Our LaneGraph2Seq approach demonstrates superior performance compared to state-of-the-art techniques in lane graph extraction.

arxiv情報

著者 Renyuan Peng,Xinyue Cai,Hang Xu,Jiachen Lu,Feng Wen,Wei Zhang,Li Zhang
発行日 2024-02-19 15:32:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク