要約
自動運転における正確な 3D オブジェクト検出のための、Shift-SSD と呼ばれる新しい 3D ポイントベースの検出器モデルを紹介します。
従来のポイントベースの 3D オブジェクト検出器は、多くの場合、ポイントのプログレッシブ ダウンサンプリングに依存するアーキテクチャを採用しています。
この方法は、計算需要を効果的に削減し、受容野を増加させますが、特に複雑な運転シナリオにおいて、正確な 3D 物体検出のための重要な非局所情報の保存を損なうことになります。
これに対処するために、無視できるオーバーヘッドのみを含めながら長距離の相互依存関係を効率的にモデル化することにより、ポイントベースの検出器の表現能力を解放する興味深いクラスター間シフト操作を導入します。
具体的には、クロスクラスターシフト操作は、隣接するクラスターから部分チャネルをシフトすることで従来の設計を強化し、非局所領域とのより豊富な相互作用を可能にし、クラスターの受容野を拡大します。
私たちは KITTI、Waymo、nuScenes データセットに対して広範な実験を実施しており、その結果は検出精度とランタイム効率の両方において Shift-SSD の最先端のパフォーマンスを実証しています。
要約(オリジナル)
We present a new 3D point-based detector model, named Shift-SSD, for precise 3D object detection in autonomous driving. Traditional point-based 3D object detectors often employ architectures that rely on a progressive downsampling of points. While this method effectively reduces computational demands and increases receptive fields, it will compromise the preservation of crucial non-local information for accurate 3D object detection, especially in the complex driving scenarios. To address this, we introduce an intriguing Cross-Cluster Shifting operation to unleash the representation capacity of the point-based detector by efficiently modeling longer-range inter-dependency while including only a negligible overhead. Concretely, the Cross-Cluster Shifting operation enhances the conventional design by shifting partial channels from neighboring clusters, which enables richer interaction with non-local regions and thus enlarges the receptive field of clusters. We conduct extensive experiments on the KITTI, Waymo, and nuScenes datasets, and the results demonstrate the state-of-the-art performance of Shift-SSD in both detection accuracy and runtime efficiency.
arxiv情報
著者 | Zhili Chen,Kien T. Pham,Maosheng Ye,Zhiqiang Shen,Qifeng Chen |
発行日 | 2024-03-10 10:36:32+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google