Quantifying Data Augmentation for LiDAR based 3D Object Detection

要約

この作業では、Light Detection and Ranging (LiDAR) ベースの 3D オブジェクト検出で一般的に使用されるさまざまなデータ拡張技術に光を当てます。
実験の大部分では、よく知られている PointPillars パイプラインと確立された KITTI データセットを利用しています。
さまざまなグローバルおよびローカル拡張技術を調査します。グローバル拡張技術はシーンの点群全体に適用され、ローカル拡張技術はシーン内の個々のオブジェクトに属するポイントにのみ適用されます。
私たちの調査結果は、両方のタイプのデータ拡張がパフォーマンスの向上につながる可能性があることを示していますが、たとえば個々のオブジェクトの変換などの一部の拡張技術は逆効果であり、全体的なパフォーマンスを損なう可能性があることも判明しています.
これらの調査結果は、他の最先端の 3D オブジェクト検出方法や挑戦的な STF データセットにうまく適用され、一般化されることを示しています。
KITTI データセットでは、中程度の自動車クラスの 3D mAP で最大 1.5%、STF データセットでは最大 1.7% を得ることができます。

要約(オリジナル)

In this work, we shed light on different data augmentation techniques commonly used in Light Detection and Ranging (LiDAR) based 3D Object Detection. For the bulk of our experiments, we utilize the well known PointPillars pipeline and the well established KITTI dataset. We investigate a variety of global and local augmentation techniques, where global augmentation techniques are applied to the entire point cloud of a scene and local augmentation techniques are only applied to points belonging to individual objects in the scene. Our findings show that both types of data augmentation can lead to performance increases, but it also turns out, that some augmentation techniques, such as individual object translation, for example, can be counterproductive and can hurt the overall performance. We show that these findings transfer and generalize well to other state of the art 3D Object Detection methods and the challenging STF dataset. On the KITTI dataset we can gain up to 1.5% and on the STF dataset up to 1.7% in 3D mAP on the moderate car class.

arxiv情報

著者 Martin Hahner,Dengxin Dai,Alexander Liniger,Luc Van Gool
発行日 2022-07-29 11:43:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク