Self-Supervised Pre-Training Boosts Semantic Scene Segmentation on LiDAR data

要約

航空機搭載 LiDAR システムは、主に 3D 座標によって定義された点で構成される広範な点群データを生成することにより、地表を捕捉する機能を備えています。
ただし、教師あり学習タスクのそのようなポイントにラベルを付けるには時間がかかります。
その結果、ラベルのないデータから学習して、注釈付きサンプルの数を大幅に削減できる手法を調査する必要があります。
この研究では、Barlow Twins を使用して自己教師ありエンコーダをトレーニングし、それをセマンティック シーン セグメンテーションのタスクで事前トレーニングされたネットワークとして使用することを提案します。
実験結果は、教師なし事前トレーニングが、教師ありタスクで微調整されると、特に過小評価されているカテゴリのパフォーマンスを向上させることを示しています。

要約(オリジナル)

Airborne LiDAR systems have the capability to capture the Earth’s surface by generating extensive point cloud data comprised of points mainly defined by 3D coordinates. However, labeling such points for supervised learning tasks is time-consuming. As a result, there is a need to investigate techniques that can learn from unlabeled data to significantly reduce the number of annotated samples. In this work, we propose to train a self-supervised encoder with Barlow Twins and use it as a pre-trained network in the task of semantic scene segmentation. The experimental results demonstrate that our unsupervised pre-training boosts performance once fine-tuned on the supervised task, especially for under-represented categories.

arxiv情報

著者 Mariona Carós,Ariadna Just,Santi Seguí,Jordi Vitrià
発行日 2023-09-05 11:29:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク