STONE: A Submodular Optimization Framework for Active 3D Object Detection

要約

3D物体検出は、自律走行やロボット工学を含む様々な新しいアプリケーションにとって基本的に重要である。正確な3D物体検出器をトレーニングするための重要な要件は、大量のLiDARベースの点群データが利用可能であることです。残念ながら、点群データのラベリングは非常に困難であり、正確な3Dバウンディングボックスとセマンティックラベルが各物体候補に必要である。本論文では、3Dオブジェクト検出器をトレーニングする際のラベリングコストを大幅に削減するための、統一されたアクティブ3Dオブジェクト検出フレームワークを提案する。我々のフレームワークは、サブモジュラー最適化の新しい定式化に基づいており、特にアクティブ3Dオブジェクト検出の問題に適合している。特に、アクティブ3Dオブジェクト検出に関連する2つの基本的な課題、すなわち、データの不均衡と、様々な難易度のLiDARベースの点群データを含むデータの分布をカバーする必要性に対処する。広範な実験により、我々の手法が、既存の能動学習手法と比較して、高い計算効率で最先端の性能を達成することが実証された。コードはhttps://github.com/RuiyuM/STONE。

要約(オリジナル)

3D object detection is fundamentally important for various emerging applications, including autonomous driving and robotics. A key requirement for training an accurate 3D object detector is the availability of a large amount of LiDAR-based point cloud data. Unfortunately, labeling point cloud data is extremely challenging, as accurate 3D bounding boxes and semantic labels are required for each potential object. This paper proposes a unified active 3D object detection framework, for greatly reducing the labeling cost of training 3D object detectors. Our framework is based on a novel formulation of submodular optimization, specifically tailored to the problem of active 3D object detection. In particular, we address two fundamental challenges associated with active 3D object detection: data imbalance and the need to cover the distribution of the data, including LiDAR-based point cloud data of varying difficulty levels. Extensive experiments demonstrate that our method achieves state-of-the-art performance with high computational efficiency compared to existing active learning methods. The code is available at https://github.com/RuiyuM/STONE.

arxiv情報

著者 Ruiyu Mao,Sarthak Kumar Maharana,Rishabh K Iyer,Yunhui Guo
発行日 2024-11-01 05:23:35+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク