SCP: Scene Completion Pre-training for 3D Object Detection

要約

LiDAR 点群を使用した 3D 物体検出は、コンピューター ビジョン、ロボット工学、自動運転の分野における基本的なタスクです。
ただし、既存の 3D 検出器は注釈付きのデータセットに大きく依存しているため、時間がかかり、3D 境界ボックスのラベル付けプロセス中にエラーが発生しやすくなります。
この論文では、ラベル付けされたデータが少ない 3D オブジェクト検出器のパフォーマンスを向上させるシーン補完事前トレーニング (SCP) 方法を提案します。
SCP には 3 つの重要な利点があります: (1) 点群モデルの初期化が改善されました。
シーン点群を完成させることにより、SCP は都市環境内のオブジェクト間の空間的および意味論的な関係を効果的にキャプチャします。
(2) 追加のデータセットの必要性の排除。
SCP は、3D 検出器に追加の労力やデータ要件を課すことのない貴重な補助ネットワークとして機能します。
(3)検出用の標識データ量の削減。
SCP の助けにより、既存の最先端の 3D 検出器は、ラベル付きデータの 20% のみに依存しながら、同等のパフォーマンスを達成できます。

要約(オリジナル)

3D object detection using LiDAR point clouds is a fundamental task in the fields of computer vision, robotics, and autonomous driving. However, existing 3D detectors heavily rely on annotated datasets, which are both time-consuming and prone to errors during the process of labeling 3D bounding boxes. In this paper, we propose a Scene Completion Pre-training (SCP) method to enhance the performance of 3D object detectors with less labeled data. SCP offers three key advantages: (1) Improved initialization of the point cloud model. By completing the scene point clouds, SCP effectively captures the spatial and semantic relationships among objects within urban environments. (2) Elimination of the need for additional datasets. SCP serves as a valuable auxiliary network that does not impose any additional efforts or data requirements on the 3D detectors. (3) Reduction of the amount of labeled data for detection. With the help of SCP, the existing state-of-the-art 3D detectors can achieve comparable performance while only relying on 20% labeled data.

arxiv情報

著者 Yiming Shan,Yan Xia,Yuhong Chen,Daniel Cremers
発行日 2023-09-12 13:08:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク