この高度にインテリジェントな問題には、車線の接続関係と、車線と交通要素の間の割り当て関係という 2 つの側面が含まれており、包括的なトポロジー推論手法が不足しています。
または、以前のレーン トポロジ指向のアプローチは中心線の検出に重点を置き、相互作用モデリングを無視します。
一方、車線への交通要素の割り当て問題は画像領域に限定されており、2 つのビューから対応関係を構築する方法は未解明の課題となっています。
これらの問題に対処するために、従来の認識タスクを超えて交通知識を抽象化できる初のエンドツーエンド フレームワークである TopoNet を紹介します。
運転シーンのトポロジをキャプチャするために、次の 3 つの主要な設計を導入します。(1) 2D 要素からの意味論的な知識を統合された特徴空間に組み込むための埋め込みモジュール。
(2) 関係をモデル化し、ネットワーク内での機能の相互作用を可能にする厳選されたシーン グラフ ニューラル ネットワーク。
(3) メッセージを恣意的に送信する代わりに、さまざまな種類の道路ゲノムから事前知識を区別するためにシーン知識グラフが考案されています。
私たちは、挑戦的なシーン理解ベンチマークである OpenLane-V2 で TopoNet を評価しました。このベンチマークでは、私たちのアプローチは、すべての知覚的およびトポロジー的メトリクスにおいて、これまでのすべての研究を大幅に上回っています。
コードは https://github.com/OpenDriveLab/TopoNet でリリースされています。
Understanding the road genome is essential to realize autonomous driving. This highly intelligent problem contains two aspects – the connection relationship of lanes, and the assignment relationship between lanes and traffic elements, where a comprehensive topology reasoning method is vacant. On one hand, previous map learning techniques struggle in deriving lane connectivity with segmentation or laneline paradigms; or prior lane topology-oriented approaches focus on centerline detection and neglect the interaction modeling. On the other hand, the traffic element to lane assignment problem is limited in the image domain, leaving how to construct the correspondence from two views an unexplored challenge. To address these issues, we present TopoNet, the first end-to-end framework capable of abstracting traffic knowledge beyond conventional perception tasks. To capture the driving scene topology, we introduce three key designs: (1) an embedding module to incorporate semantic knowledge from 2D elements into a unified feature space; (2) a curated scene graph neural network to model relationships and enable feature interaction inside the network; (3) instead of transmitting messages arbitrarily, a scene knowledge graph is devised to differentiate prior knowledge from various types of the road genome. We evaluate TopoNet on the challenging scene understanding benchmark, OpenLane-V2, where our approach outperforms all previous works by a great margin on all perceptual and topological metrics. The code is released at https://github.com/OpenDriveLab/TopoNet
著者 | Tianyu Li,Li Chen,Huijie Wang,Yang Li,Jiazhi Yang,Xiangwei Geng,Shengyin Jiang,Yuting Wang,Hang Xu,Chunjing Xu,Junchi Yan,Ping Luo,Hongyang Li |
発行日 | 2023-08-28 10:51:09+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google