TraIL-Det: Transformation-Invariant Local Feature Networks for 3D LiDAR Object Detection with Unsupervised Pre-Training

要約

3D 点群は、特に自動運転の領域において、屋外のシーンを認識するために不可欠です。
3D LiDAR 物体検出の最近の進歩は、正確な検出を保証するために主に点の空間的位置決めと分布に焦点を当てています。
ただし、これらの方法は、変動する条件下で堅牢なパフォーマンスを発揮するにもかかわらず、座標と点の強度のみに依存しているため妨げられ、等尺性不変性が不十分になり、最適な検出結果が得られません。
この課題に取り組むために、私たちの研究では、Transformation-Invariant Local (TraIL) 機能と関連する TraIL-Det アーキテクチャを導入しました。
弊社の TraIL 機能は、剛体変換不変性を示し、隣接する構造の局所的な形状を捉えることに重点を置いた設計で、点密度の変化に効果的に適応します。
これらは、LiDAR の固有の等方性放射を利用して、ローカル表現を強化し、計算効率を向上させ、検出パフォーマンスを向上させます。
各提案内の点間の幾何学的関係を効果的に処理するために、高次元の TraIL 特徴を管理可能な表現にエンコードする非対称幾何学的特徴を備えたマルチヘッド セルフ アテンション エンコーダ (MAE) を提案します。
私たちの方法は、さまざまなラベル比(20%、50%、および
100%)。

要約(オリジナル)

3D point clouds are essential for perceiving outdoor scenes, especially within the realm of autonomous driving. Recent advances in 3D LiDAR Object Detection focus primarily on the spatial positioning and distribution of points to ensure accurate detection. However, despite their robust performance in variable conditions, these methods are hindered by their sole reliance on coordinates and point intensity, resulting in inadequate isometric invariance and suboptimal detection outcomes. To tackle this challenge, our work introduces Transformation-Invariant Local (TraIL) features and the associated TraIL-Det architecture. Our TraIL features exhibit rigid transformation invariance and effectively adapt to variations in point density, with a design focus on capturing the localized geometry of neighboring structures. They utilize the inherent isotropic radiation of LiDAR to enhance local representation, improve computational efficiency, and boost detection performance. To effectively process the geometric relations among points within each proposal, we propose a Multi-head self-Attention Encoder (MAE) with asymmetric geometric features to encode high-dimensional TraIL features into manageable representations. Our method outperforms contemporary self-supervised 3D object detection approaches in terms of mAP on KITTI (67.8, 20% label, moderate) and Waymo (68.9, 20% label, moderate) datasets under various label ratios (20%, 50%, and 100%).

arxiv情報

著者 Li Li,Tanqiu Qiao,Hubert P. H. Shum,Toby P. Breckon
発行日 2024-08-25 17:59:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク