PillarHist: A Quantization-aware Pillar Feature Encoder based on Height-aware Histogram

要約

リアルタイムの高性能 3D 物体検出は、自動運転とロボット工学において重要な役割を果たします。
最近のピラーベースの 3D オブジェクト検出器は、そのコンパクトな表現と低い計算オーバーヘッドにより、オンボード展開や量子化に適しているため、大きな注目を集めています。
しかし、既存のピラーベースの検出器は依然として、ピラー特徴エンコード (PFE) 中の高さ方向の情報損失と大きな数値分布の違いに悩まされており、パフォーマンスと量子化の可能性が大幅に制限されています。
上記の問題に対処するために、まず PFE 中のさまざまな入力情報の重要性を明らかにし、3D 検出パフォーマンスを向上させる重要な要素として高さ寸法を特定します。
この観察に基づいて、私たちは PillarHist という名前の高さを認識した柱特徴エンコーダーを提案します。
具体的には、PillarHist は、1 つの柱内のさまざまな高さの点の離散分布を統計します。
このシンプルかつ効果的な設計により、PFE の計算オーバーヘッドが大幅に削減されながら、高さ方向の情報が大幅に保存されます。
一方、PillarHist は PFE 入力の算術分布を安定した範囲に制限するため、量子化に適しています。
特に、PillarHist はパフォーマンスを向上させるために PFE ステージ内でのみ動作し、複雑な操作を導入することなく既存のピラーベースのメソッドへのシームレスな統合を可能にします。
広範な実験により、効率とパフォーマンスの両方の点で PillarHist の有効性が示されています。

要約(オリジナル)

Real-time and high-performance 3D object detection plays a critical role in autonomous driving and robotics. Recent pillar-based 3D object detectors have gained significant attention due to their compact representation and low computational overhead, making them suitable for onboard deployment and quantization. However, existing pillar-based detectors still suffer from information loss along height dimension and large numerical distribution difference during pillar feature encoding (PFE), which severely limits their performance and quantization potential. To address above issue, we first unveil the importance of different input information during PFE and identify the height dimension as a key factor in enhancing 3D detection performance. Motivated by this observation, we propose a height-aware pillar feature encoder named PillarHist. Specifically, PillarHist statistics the discrete distribution of points at different heights within one pillar. This simple yet effective design greatly preserves the information along the height dimension while significantly reducing the computation overhead of the PFE. Meanwhile, PillarHist also constrains the arithmetic distribution of PFE input to a stable range, making it quantization-friendly. Notably, PillarHist operates exclusively within the PFE stage to enhance performance, enabling seamless integration into existing pillar-based methods without introducing complex operations. Extensive experiments show the effectiveness of PillarHist in terms of both efficiency and performance.

arxiv情報

著者 Sifan Zhou,Zhihang Yuan,Dawei Yang,Xubin Wen,Xing Hu,Yuguang Shi,Ziyu Zhao,Xiaobo Lu
発行日 2024-05-29 03:28:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク