Rethinking Dimensionality Reduction in Grid-based 3D Object Detection

要約

鳥瞰図 (BEV) は、十分に調査された 2D 検出技術の適用性により、現在の点群検出器のほとんどで広く採用されています。
ただし、既存の方法では、高さ次元に沿ってボクセルまたはポイント フィーチャを単純に折りたたむことで BEV フィーチャを取得するため、3D 空間情報の大幅な損失が発生します。
情報の損失を軽減するために、MDRNet と呼ばれるマルチレベルの特徴次元削減戦略に基づく新しい点群検出ネットワークを提案します。
MDRNet では、空間認識次元削減 (SDR) は、ボクセルから BEV 機能への変換中にオブジェクトの重要な部分に動的に焦点を当てるように設計されています。
さらに、マルチレベル空間残差 (MSR) を提案して、BEV フィーチャ マップ内のマルチレベル空間情報を融合します。
nuScenes に関する広範な実験では、提案された方法が最先端の方法よりも優れていることが示されています。
コードは公開時に利用可能になります。

要約(オリジナル)

Bird’s eye view (BEV) is widely adopted by most of the current point cloud detectors due to the applicability of well-explored 2D detection techniques. However, existing methods obtain BEV features by simply collapsing voxel or point features along the height dimension, which causes the heavy loss of 3D spatial information. To alleviate the information loss, we propose a novel point cloud detection network based on a Multi-level feature dimensionality reduction strategy, called MDRNet. In MDRNet, the Spatial-aware Dimensionality Reduction (SDR) is designed to dynamically focus on the valuable parts of the object during voxel-to-BEV feature transformation. Furthermore, the Multi-level Spatial Residuals (MSR) is proposed to fuse the multi-level spatial information in the BEV feature maps. Extensive experiments on nuScenes show that the proposed method outperforms the state-of-the-art methods. The code will be available upon publication.

arxiv情報

著者 Dihe Huang,Ying Chen,Yikang Ding,Jinli Liao,Jianlin Liu,Kai Wu,Qiang Nie,Yong Liu,Chengjie Wang,Zhiheng Li
発行日 2023-01-27 13:16:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク