LaserMix for Semi-Supervised LiDAR Semantic Segmentation

要約

タイトル:LaserMixを用いた半教師ありLiDARセマンティックセグメンテーション

要約:

– LiDAR点群の密度のある批判はコストがかかり、完全教師あり学習手法のスケーラビリティを制限する。
– 本研究では、LiDARセグメンテーションにおける未開拓領域である半教師あり学習(SSL)について研究する。
– LaserMixを提案し、異なるLiDARスキャンからレーザービームを混合して、モデルが混合前後の一貫性のある確信度の高い予測を行うように促すことで、未ラベルデータをより効果的に活用する。
– LaserMixの枠組みは以下の3つの魅力的な特性を持つ。
1) 汎用: LaserMixはLiDAR表現に対して無関係であり、したがって、SSLフレームワークは普遍的に適用可能である。
2) 統計的に根拠がある: 提案されたフレームワークの適用性を理論的に説明するために、詳細な分析を提供する。
3) 有効: 人気のあるLiDARセグメンテーションデータセット(nuScenes、SemanticKITTI、ScribbleKITTI)での包括的な実験分析は、我々の有効性と優位性を実証する。特に、完全教師あり対照群に対して2倍から5倍のラベルで競争力のある結果を得たり、教師ありベースラインを平均で10.8%改善することができる。
– この簡潔で高い性能を発揮するフレームワークが、将来の半教師ありLiDARセグメンテーション研究を促進することを願っています。コードは公開されています。

要約(オリジナル)

Densely annotating LiDAR point clouds is costly, which restrains the scalability of fully-supervised learning methods. In this work, we study the underexplored semi-supervised learning (SSL) in LiDAR segmentation. Our core idea is to leverage the strong spatial cues of LiDAR point clouds to better exploit unlabeled data. We propose LaserMix to mix laser beams from different LiDAR scans, and then encourage the model to make consistent and confident predictions before and after mixing. Our framework has three appealing properties: 1) Generic: LaserMix is agnostic to LiDAR representations (e.g., range view and voxel), and hence our SSL framework can be universally applied. 2) Statistically grounded: We provide a detailed analysis to theoretically explain the applicability of the proposed framework. 3) Effective: Comprehensive experimental analysis on popular LiDAR segmentation datasets (nuScenes, SemanticKITTI, and ScribbleKITTI) demonstrates our effectiveness and superiority. Notably, we achieve competitive results over fully-supervised counterparts with 2x to 5x fewer labels and improve the supervised-only baseline significantly by 10.8% on average. We hope this concise yet high-performing framework could facilitate future research in semi-supervised LiDAR segmentation. Code is publicly available.

arxiv情報

著者 Lingdong Kong,Jiawei Ren,Liang Pan,Ziwei Liu
発行日 2023-04-13 12:53:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV, cs.LG, cs.RO パーマリンク