LaserMix for Semi-Supervised LiDAR Semantic Segmentation

要約

LiDAR点群に高密度のアノテーションを付けることはコストがかかり、完全教師あり学習法のスケーラビリティを抑制する。本研究では、LiDARセグメンテーションにおいて未開拓の半教師付き学習(SSL)を研究する。我々の核となるアイデアは、LiDAR点群の強力な空間的手がかりを活用し、ラベル付けされていないデータをより良く利用することである。我々はLaserMixを提案し、異なるLiDARスキャンからのレーザービームをミックスし、ミックス前とミックス後の一貫した確信のある予測を行うようモデルを促す。我々のフレームワークには3つの魅力的な特性がある:1) 汎用的:LaserMixはLiDARの表現(レンジビューやボクセルなど)にとらわれないため、我々のSSLフレームワークは普遍的に適用することができます。2) 統計的根拠がある:提案するフレームワークの適用可能性を理論的に説明するための詳細な分析を提供します。3) 効果的:一般的なLiDARセグメンテーションデータセット(nuScenes、SemanticKITTI、ScribbleKITTI)を用いた包括的な実験分析により、我々の有効性と優位性を実証する。特に、2倍から5倍少ないラベル数で、完全教師ありのデータセットに対して競争力のある結果を達成し、教師ありのみのベースラインを平均10.8%大幅に改善した。この簡潔かつ高性能なフレームワークが、半教師付きLiDARセグメンテーションにおける将来の研究を促進することを期待している。コードは公開されている。

要約(オリジナル)

Densely annotating LiDAR point clouds is costly, which restrains the scalability of fully-supervised learning methods. In this work, we study the underexplored semi-supervised learning (SSL) in LiDAR segmentation. Our core idea is to leverage the strong spatial cues of LiDAR point clouds to better exploit unlabeled data. We propose LaserMix to mix laser beams from different LiDAR scans, and then encourage the model to make consistent and confident predictions before and after mixing. Our framework has three appealing properties: 1) Generic: LaserMix is agnostic to LiDAR representations (e.g., range view and voxel), and hence our SSL framework can be universally applied. 2) Statistically grounded: We provide a detailed analysis to theoretically explain the applicability of the proposed framework. 3) Effective: Comprehensive experimental analysis on popular LiDAR segmentation datasets (nuScenes, SemanticKITTI, and ScribbleKITTI) demonstrates our effectiveness and superiority. Notably, we achieve competitive results over fully-supervised counterparts with 2x to 5x fewer labels and improve the supervised-only baseline significantly by 10.8% on average. We hope this concise yet high-performing framework could facilitate future research in semi-supervised LiDAR segmentation. Code is publicly available.

arxiv情報

著者 Lingdong Kong,Jiawei Ren,Liang Pan,Ziwei Liu
発行日 2023-09-01 09:58:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク