Learning Road Scene-level Representations via Semantic Region Prediction

要約

この作業では、自動運転システムにおける 2 つの重要なタスク、つまり、ドライバーの意図予測と自己中心的な画像からのリスク オブジェクトの識別に取り組みます。
主に、これら 2 つのタスクに適した道路シーン レベルの表現は何かという質問を調査します。
シーンレベルの表現は、目的地へのアクションを実行している間、自車両の周りの交通シーンのより高いレベルの意味的および幾何学的表現をキャプチャする必要があると主張します。
この目的のために、意味領域の表現を導入します。これは、自我車両が与えられた行動 (4 方向交差点での左折など) を行っているときに訪れる領域です。
新しい意味領域予測タスクと自動意味領域ラベル付けアルゴリズムを介してシーンレベルの表現を学習することを提案します。
HDD と nuScenes のデータセットに対して広範な評価が行われ、学習された表現は、ドライバーの意図予測とリスク オブジェクトの識別のための最先端のパフォーマンスにつながります。

要約(オリジナル)

In this work, we tackle two vital tasks in automated driving systems, i.e., driver intent prediction and risk object identification from egocentric images. Mainly, we investigate the question: what would be good road scene-level representations for these two tasks? We contend that a scene-level representation must capture higher-level semantic and geometric representations of traffic scenes around ego-vehicle while performing actions to their destinations. To this end, we introduce the representation of semantic regions, which are areas where ego-vehicles visit while taking an afforded action (e.g., left-turn at 4-way intersections). We propose to learn scene-level representations via a novel semantic region prediction task and an automatic semantic region labeling algorithm. Extensive evaluations are conducted on the HDD and nuScenes datasets, and the learned representations lead to state-of-the-art performance for driver intention prediction and risk object identification.

arxiv情報

著者 Zihao Xiao,Alan Yuille,Yi-Ting Chen
発行日 2023-01-02 15:13:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク