要約
2D オブジェクト検出の最近の進歩は、カスケード RCNN を特徴としています。これは、一連のカスケード検出器を利用して、提案の品質を徐々に改善し、高品質のオブジェクト検出に向けています。
ただし、非常にまばらな LiDAR 点群を使用した困難な検出シナリオである 3D オブジェクト検出のために、このようなカスケード構造を構築することを支持する証拠はありません。
この作業では、カスケード パラダイムでボクセル化された点群に基づいて複数の検出器を割り当て、より高品質の 3D オブジェクト検出器を徐々に追求する、3D Cascade RCNN という名前のシンプルで効果的なカスケード アーキテクチャを紹介します。
さらに、各オブジェクトの 3D バウンディング ボックス内のポイントのスパース レベルをポイント完全性スコアとして定量的に定義します。これは、各提案のタスクの重みとして利用され、各ステージ検出器の学習を導きます。
背後にある精神は、比較的完全なポイント分布を持つ高品質の提案に高い重みを割り当てる一方で、トレーニング中にノイズが発生することが多い非常にまばらなポイントを持つ提案の重みを下げることです。
完全性を意識した再重み付けのこの設計は、FLOP 予算を増やすことなく、カスケード パラダイムをスパース入力データにより適切に適用できるようにエレガントにアップグレードします。
KITTI データセットと Waymo Open Dataset の両方で広範な実験を行い、最先端の 3D オブジェクト検出技術と比較して、提案した 3D Cascade RCNN の優位性を検証します。
ソース コードは、\url{https://github.com/caiqi/Cascasde-3D} で公開されています。
要約(オリジナル)
Recent progress on 2D object detection has featured Cascade RCNN, which capitalizes on a sequence of cascade detectors to progressively improve proposal quality, towards high-quality object detection. However, there has not been evidence in support of building such cascade structures for 3D object detection, a challenging detection scenario with highly sparse LiDAR point clouds. In this work, we present a simple yet effective cascade architecture, named 3D Cascade RCNN, that allocates multiple detectors based on the voxelized point clouds in a cascade paradigm, pursuing higher quality 3D object detector progressively. Furthermore, we quantitatively define the sparsity level of the points within 3D bounding box of each object as the point completeness score, which is exploited as the task weight for each proposal to guide the learning of each stage detector. The spirit behind is to assign higher weights for high-quality proposals with relatively complete point distribution, while down-weight the proposals with extremely sparse points that often incur noise during training. This design of completeness-aware re-weighting elegantly upgrades the cascade paradigm to be better applicable for the sparse input data, without increasing any FLOP budgets. Through extensive experiments on both the KITTI dataset and Waymo Open Dataset, we validate the superiority of our proposed 3D Cascade RCNN, when comparing to state-of-the-art 3D object detection techniques. The source code is publicly available at \url{https://github.com/caiqi/Cascasde-3D}.
arxiv情報
著者 | Qi Cai,Yingwei Pan,Ting Yao,Tao Mei |
発行日 | 2022-11-15 15:58:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google