Large receptive field strategy and important feature extraction strategy in 3D object detection

要約

3D オブジェクト検出の強化は、正確な環境認識と自動運転におけるタスク実行能力の向上にとって極めて重要です。
正確な深度情報を提供する LiDAR 点群は、この目的にとって重要な情報として機能します。
私たちの研究は、3D ターゲット検出における主要な課題に焦点を当てています。
3D 畳み込みカーネルの受容野を拡大するという課題に取り組むために、動的特徴融合モジュール (DFFM) を導入します。
このモジュールは、3D 畳み込みカーネルの受容場の適応的拡張を実現し、拡張と許容可能な計算負荷のバランスをとります。
この技術革新により、操作が軽減され、受容野が拡張され、モデルがさまざまなオブジェクトの要件に動的に調整できるようになります。
同時に、3D フィーチャ内の冗長な情報を特定します。
特徴選択モジュール (FSM) を採用すると、重要でない特徴が定量的に評価されて削除され、出力ボックスのフィッティングと特徴抽出の分離が実現します。
この革新により、検出器は重要な特徴に焦点を当てることができ、その結果、モデルが圧縮され、計算負荷が軽減され、候補フレームの干渉が最小限に抑えられます。
広範な実験により、DFFM と FSM の両方が、特に小型ターゲットの検出において現在のベンチマークを強化するだけでなく、ネットワーク パフォーマンスも高速化することが確認されています。
重要なのは、これらのモジュールが効果的な相補性を示していることです。

要約(オリジナル)

The enhancement of 3D object detection is pivotal for precise environmental perception and improved task execution capabilities in autonomous driving. LiDAR point clouds, offering accurate depth information, serve as a crucial information for this purpose. Our study focuses on key challenges in 3D target detection. To tackle the challenge of expanding the receptive field of a 3D convolutional kernel, we introduce the Dynamic Feature Fusion Module (DFFM). This module achieves adaptive expansion of the 3D convolutional kernel’s receptive field, balancing the expansion with acceptable computational loads. This innovation reduces operations, expands the receptive field, and allows the model to dynamically adjust to different object requirements. Simultaneously, we identify redundant information in 3D features. Employing the Feature Selection Module (FSM) quantitatively evaluates and eliminates non-important features, achieving the separation of output box fitting and feature extraction. This innovation enables the detector to focus on critical features, resulting in model compression, reduced computational burden, and minimized candidate frame interference. Extensive experiments confirm that both DFFM and FSM not only enhance current benchmarks, particularly in small target detection, but also accelerate network performance. Importantly, these modules exhibit effective complementarity.

arxiv情報

著者 Leichao Cui,Xiuxian Li,Min Meng
発行日 2024-01-22 13:01:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク