Rethinking Voxelization and Classification for 3D Object Detection

要約

LiDAR点群からの3次元物体検出における主な課題は、ネットワークの信頼性に影響を与えることなくリアルタイム性能を達成することです。言い換えれば、検出ネットワークは、その予測について十分な信頼性を持っていなければならない。本論文では、ボクセライザーが低速ボクセルベースモデルで動作するのと同様に、高速ピラーベースモデルで動作する高速ダイナミックボクセライザーを実装することにより、ネットワークの推論速度と精度を同時に改善するソリューションを提案する。さらに、予測された物体を分類するための軽量な検出サブヘッドモデルを提案し、無視できる時間と計算コストでモデルの精度を大幅に向上させる誤検出物体のフィルタリングを行う。開発したコードは、https://github.com/YoushaaMurhij/RVCDet で公開されています。

要約(オリジナル)

The main challenge in 3D object detection from LiDAR point clouds is achieving real-time performance without affecting the reliability of the network. In other words, the detecting network must be confident enough about its predictions. In this paper, we present a solution to improve network inference speed and precision at the same time by implementing a fast dynamic voxelizer that works on fast pillar-based models in the same way a voxelizer works on slow voxel-based models. In addition, we propose a lightweight detection sub-head model for classifying predicted objects and filter out false detected objects that significantly improves model precision in a negligible time and computing cost. The developed code is publicly available at: https://github.com/YoushaaMurhij/RVCDet.

arxiv情報

著者 Youshaa Murhij,Alexander Golodkov,Dmitry Yudin
発行日 2023-01-10 16:22:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV パーマリンク