Sample, Crop, Track: Self-Supervised Mobile 3D Object Detection for Urban Driving LiDAR

要約

ディープ ラーニングは、近年、都市部の運転シーンにおけるモバイル (つまり、移動可能な) オブジェクトの検出に大きな進歩をもたらしました。
教師ありアプローチでは通常、大規模なトレーニング セットの注釈が必要です。
したがって、これを回避するために弱い、半または自己教師付きの方法を活用することに大きな関心が寄せられており、多くの成功を収めています。
弱い教師あり方法と半教師あり方法には何らかの注釈が必要ですが、自己教師あり方法ではモーションなどの手がかりを使用して、注釈の必要性を完全に軽減しています。
ただし、アノテーションがまったくない場合、通常はパフォーマンスが低下し、モーションのグループ化中に発生するあいまいさが正確なオブジェクト境界を見つける能力を阻害する可能性があります。
この論文では、SCTと呼ばれる新しい自己教師付き移動体検出アプローチを提案します。
これは、モーション キューと予想されるオブジェクト サイズの両方を使用して検出パフォーマンスを向上させ、3D 指向のバウンディング ボックスの密なグリッドを予測してオブジェクトの発見を向上させます。
KITTI 追跡ベンチマークで最先端の自己監視型移動体検出手法 TCR を大幅に上回り、IoUs <= 0.5 で完全監視型 PV-RCNN++ 手法の 30% 以内のパフォーマンスを達成しています。

要約(オリジナル)

Deep learning has led to great progress in the detection of mobile (i.e. movement-capable) objects in urban driving scenes in recent years. Supervised approaches typically require the annotation of large training sets; there has thus been great interest in leveraging weakly, semi- or self-supervised methods to avoid this, with much success. Whilst weakly and semi-supervised methods require some annotation, self-supervised methods have used cues such as motion to relieve the need for annotation altogether. However, a complete absence of annotation typically degrades their performance, and ambiguities that arise during motion grouping can inhibit their ability to find accurate object boundaries. In this paper, we propose a new self-supervised mobile object detection approach called SCT. This uses both motion cues and expected object sizes to improve detection performance, and predicts a dense grid of 3D oriented bounding boxes to improve object discovery. We significantly outperform the state-of-the-art self-supervised mobile object detection method TCR on the KITTI tracking benchmark, and achieve performance that is within 30% of the fully supervised PV-RCNN++ method for IoUs <= 0.5.

arxiv情報

著者 Sangyun Shin,Stuart Golodetz,Madhu Vankadari,Kaichen Zhou,Andrew Markham,Niki Trigoni
発行日 2022-09-21 16:12:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T45, cs.CV, cs.LG, cs.RO, I.2.10 パーマリンク