要約
シーンの完了と予測は、自動運転車などのモバイル エージェントの研究においてよく知られる 2 つの認識問題です。
既存のアプローチでは 2 つの問題を分離して扱うため、2 つの側面が別々に認識されてしまいます。
このペーパーでは、自動運転のコンテキストにおける占有完了および予測 (OCF) という新しい LiDAR 認識タスクを導入し、これらの側面を一貫したフレームワークに統合します。
このタスクでは、(1) 疎から密への再構成、(2) 部分から完全への幻覚、(3) 3D から 4D の予測という 3 つの課題にすべて対処するための新しいアルゴリズムが必要です。
監視と評価を可能にするために、公開されている自動運転データセットから OCFBench と呼ばれる大規模なデータセットを厳選しています。
私たちは、密接に関連する既存のベースライン モデルと、データセット上の独自のベースライン モデルのパフォーマンスを分析します。
私たちは、この研究が刺激となり、この進化する 4D 認識の重要な領域におけるさらなる研究を促すものになると考えています。
データキュレーションとベースライン実装のためのコードは https://github.com/ai4ce/Occ4cast で入手できます。
要約(オリジナル)
Scene completion and forecasting are two popular perception problems in research for mobile agents like autonomous vehicles. Existing approaches treat the two problems in isolation, resulting in a separate perception of the two aspects. In this paper, we introduce a novel LiDAR perception task of Occupancy Completion and Forecasting (OCF) in the context of autonomous driving to unify these aspects into a cohesive framework. This task requires new algorithms to address three challenges altogether: (1) sparse-to-dense reconstruction, (2) partial-to-complete hallucination, and (3) 3D-to-4D prediction. To enable supervision and evaluation, we curate a large-scale dataset termed OCFBench from public autonomous driving datasets. We analyze the performance of closely related existing baseline models and our own ones on our dataset. We envision that this research will inspire and call for further investigation in this evolving and crucial area of 4D perception. Our code for data curation and baseline implementation is available at https://github.com/ai4ce/Occ4cast.
arxiv情報
著者 | Xinhao Liu,Moonjun Gong,Qi Fang,Haoyu Xie,Yiming Li,Hang Zhao,Chen Feng |
発行日 | 2024-09-10 13:28:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google