要約
リアルタイムおよび高性能3Dオブジェクト検出は、自律運転とロボット工学において重要な役割を果たします。
最近の柱ベースの3Dオブジェクト検出器は、コンパクトな表現と計算オーバーヘッドが低いために大きな注目を集めており、オンボードの展開と量子化に適しています。
ただし、既存の柱ベースの検出器は、高さの寸法に沿った情報損失と柱の特徴エンコード(PFE)中の大きな数値分布の違いに依然として悩まされており、パフォーマンスと量子化の可能性を厳しく制限しています。
上記の問題に対処するために、最初にPFE中に異なる入力情報の重要性を発表し、高さのディメンションを3D検出パフォーマンスを強化する重要な要因として特定します。
この観察に動機付けられて、PillarHistと呼ばれる高さに意識した柱機能エンコーダーを提案します。
具体的には、ピラーヒスト統計情報エントロピーガイダンスを備えた1つの柱内の異なる高さでのポイントの離散分布。
このシンプルでありながら効果的なデザインは、高さの次元に沿って情報を大幅に保存しながら、PFEの計算オーバーヘッドを大幅に削減します。
一方、PillarHistは、PFE入力の算術分布を安定した範囲に制約し、量子化に優しいものにします。
特に、PillarhistはPFEステージ内でのみ動作してパフォーマンスを向上させ、複雑な操作を導入せずに既存の柱ベースの方法にシームレスな統合を可能にします。
広範な実験は、効率とパフォーマンスの両方の観点からピラーヒストの有効性を示しています。
要約(オリジナル)
Real-time and high-performance 3D object detection plays a critical role in autonomous driving and robotics. Recent pillar-based 3D object detectors have gained significant attention due to their compact representation and low computational overhead, making them suitable for onboard deployment and quantization. However, existing pillar-based detectors still suffer from information loss along height dimension and large numerical distribution difference during pillar feature encoding (PFE), which severely limits their performance and quantization potential. To address above issue, we first unveil the importance of different input information during PFE and identify the height dimension as a key factor in enhancing 3D detection performance. Motivated by this observation, we propose a height-aware pillar feature encoder, called PillarHist. Specifically, PillarHist statistics the discrete distribution of points at different heights within one pillar with the information entropy guidance. This simple yet effective design greatly preserves the information along the height dimension while significantly reducing the computation overhead of the PFE. Meanwhile, PillarHist also constrains the arithmetic distribution of PFE input to a stable range, making it quantization-friendly. Notably, PillarHist operates exclusively within the PFE stage to enhance performance, enabling seamless integration into existing pillar-based methods without introducing complex operations. Extensive experiments show the effectiveness of PillarHist in terms of both efficiency and performance.
arxiv情報
著者 | Sifan Zhou,Zhihang Yuan,Dawei Yang,Ziyu Zhao,Xing Hu,Yuguang Shi,Xiaobo Lu,Qiang Wu |
発行日 | 2025-05-29 12:40:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google