From One to the Power of Many: Augmentations for Invariance to Multi-LiDAR Perception from Single-Sensor Datasets

要約

最近、ディープ ニューラル ネットワークを活用した自動運転車用の LiDAR 認識方法は、nuScenes や SemanticKITTI などの古典的なベンチマークでパフォーマンスが急激に向上しました。
ただし、このような単一センサーのセットアップでトレーニングされたモデルを最新のマルチセンサー車両に展開する場合、パフォーマンスには依然として大きなギャップがあります。
この研究では、不変性の欠如がこれらのパフォーマンスギャップの原因であるかどうかを調査し、マルチセンサー LiDAR セットアップへのより適切な移行を促進できる、アプリケーション固有のデータ拡張の形でいくつかの初期解決策を提案します。
私たちは、提案した拡張が LiDAR センサー設定全体にわたる一般化を向上させるという実験的証拠を提供し、これらの拡張がさまざまな LiDAR センサー設定のシミュレーションにおけるモデルの不変特性にどのような影響を与えるかを調査します。

要約(オリジナル)

Recently, LiDAR perception methods for autonomous vehicles, powered by deep neural networks have experienced steep growth in performance on classic benchmarks, such as nuScenes and SemanticKITTI. However, there are still large gaps in performance when deploying models trained on such single-sensor setups to modern multi-sensor vehicles. In this work, we investigate if a lack of invariance may be responsible for these performance gaps, and propose some initial solutions in the form of application-specific data augmentations, which can facilitate better transfer to multi-sensor LiDAR setups. We provide experimental evidence that our proposed augmentations improve generalization across LiDAR sensor setups, and investigate how these augmentations affect the models’ invariance properties on simulations of different LiDAR sensor setups.

arxiv情報

著者 Marc Uecker,J. Marius Zöllner
発行日 2024-09-27 09:51:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク