要約
教師なし 3D オブジェクト検出の一般的なアプローチは、クラスターベースの疑似ラベル生成と反復的な自己トレーニング プロセスに従います。
ただし、LiDAR スキャンがまばらであるため、問題が発生します。これにより、誤ったサイズと位置の疑似ラベルが生成され、検出パフォーマンスが標準以下になります。
この問題に取り組むために、この論文では、教師なし 3D オブジェクト検出のための CPD と呼ばれる Commonsense Prototype ベースの検出器を紹介します。
CPD はまず、常識的な直観に基づいて、高品質の境界ボックスと密な点を特徴とする Commonsense Prototype (CProto) を構築します。
その後、CPD は CProto から事前に得られたサイズを活用して、低品質の疑似ラベルを改良します。
さらに、CPD は、CProto からの幾何学的知識によって、まばらにスキャンされたオブジェクトの検出精度を向上させます。
CPD は、Waymo Open Dataset (WOD)、PandaSet、KITTI データセット上で最先端の教師なし 3D 検出器を大幅に上回ります。
さらに、WOD で CPD をトレーニングし、KITTI でテストすることにより、CPD は、簡単な車クラスと中程度の車クラスでそれぞれ 90.85% と 81.01% の 3D 平均精度を達成しました。
これらの成果は、CPD を完全に監視された検出器のすぐ近くに配置し、私たちの方法の重要性を強調しています。
コードは https://github.com/hailanyi/CPD で入手できます。
要約(オリジナル)
The prevalent approaches of unsupervised 3D object detection follow cluster-based pseudo-label generation and iterative self-training processes. However, the challenge arises due to the sparsity of LiDAR scans, which leads to pseudo-labels with erroneous size and position, resulting in subpar detection performance. To tackle this problem, this paper introduces a Commonsense Prototype-based Detector, termed CPD, for unsupervised 3D object detection. CPD first constructs Commonsense Prototype (CProto) characterized by high-quality bounding box and dense points, based on commonsense intuition. Subsequently, CPD refines the low-quality pseudo-labels by leveraging the size prior from CProto. Furthermore, CPD enhances the detection accuracy of sparsely scanned objects by the geometric knowledge from CProto. CPD outperforms state-of-the-art unsupervised 3D detectors on Waymo Open Dataset (WOD), PandaSet, and KITTI datasets by a large margin. Besides, by training CPD on WOD and testing on KITTI, CPD attains 90.85% and 81.01% 3D Average Precision on easy and moderate car classes, respectively. These achievements position CPD in close proximity to fully supervised detectors, highlighting the significance of our method. The code will be available at https://github.com/hailanyi/CPD.
arxiv情報
著者 | Hai Wu,Shijia Zhao,Xun Huang,Chenglu Wen,Xin Li,Cheng Wang |
発行日 | 2024-06-26 10:51:51+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google