From One to the Power of Many: Invariance to Multi-LiDAR Perception from Single-Sensor Datasets

要約

最近、ディープ ニューラル ネットワークを活用した自動運転車用の LiDAR セグメンテーション手法は、nuScenes や SemanticKITTI などの従来のベンチマークでパフォーマンスが急激に向上しました。
ただし、このような単一センサーのセットアップでトレーニングされたモデルを、複数の高解像度 LiDAR センサーを備えた最新の車両に展開する場合、パフォーマンスには依然として大きなギャップがあります。
この研究では、ラベル付きデータを必要とせずにクロスドメインの汎化を測定するためのプロキシとして機能できる、機能レベルの不変性の新しいメトリクスを導入します。
さらに、単一センサー データセットでトレーニングした場合に、マルチセンサー LiDAR セットアップへのより適切な転送を促進する 2 つのアプリケーション固有のデータ拡張を提案します。
私たちは、シミュレーションデータと実際のデータの両方で、私たちが提案する拡張がLiDARセットアップ全体の不変性を改善し、一般化の向上につながるという実験的証拠を提供します。

要約(オリジナル)

Recently, LiDAR segmentation methods for autonomous vehicles, powered by deep neural networks, have experienced steep growth in performance on classic benchmarks, such as nuScenes and SemanticKITTI. However, there are still large gaps in performance when deploying models trained on such single-sensor setups to modern vehicles with multiple high-resolution LiDAR sensors. In this work, we introduce a new metric for feature-level invariance which can serve as a proxy to measure cross-domain generalization without requiring labeled data. Additionally, we propose two application-specific data augmentations, which facilitate better transfer to multi-sensor LiDAR setups, when trained on single-sensor datasets. We provide experimental evidence on both simulated and real data, that our proposed augmentations improve invariance across LiDAR setups, leading to improved generalization.

arxiv情報

著者 Marc Uecker,J. Marius Zöllner
発行日 2025-01-24 17:21:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク