Learning Semantic Segmentation with Query Points Supervision on Aerial Images

要約

セマンティック セグメンテーションは、高解像度の衛星画像が意味のある領域に分割されるリモート センシングにおいて非常に重要です。
深層学習の最近の進歩により、衛星画像のセグメンテーションが大幅に改善されました。
ただし、これらのメソッドのほとんどは、通常、高品質のピクセルレベルのアノテーションを必要とする完全に監視された設定でトレーニングされ、取得には高価で時間がかかります。
この研究では、完全なマスク ラベルではなくクエリ ポイント アノテーションのみに依存するセマンティック セグメンテーション アルゴリズムをトレーニングするための、弱教師あり学習アルゴリズムを紹介します。
私たちが提案するアプローチは、正確なセマンティック セグメンテーションを実行し、手動アノテーションに必要なコストと時間を大幅に削減することで効率を向上させます。
具体的には、スーパーピクセルを生成し、同様の意味のあるセマンティクスをグループ化するスーパーピクセルにクエリ ポイント ラベルを拡張します。
次に、スーパーピクセルの擬似ラベルで部分的にラベル付けされた画像で監視されたセマンティック セグメンテーション モデルをトレーニングします。
航空画像データセットとさまざまなセマンティック セグメンテーション アーキテクチャで、弱教師ありトレーニング アプローチのベンチマークを行い、アノテーションの労力を削減しながら、完全教師ありトレーニングと比較して競争力のあるパフォーマンスを達成できることを示しました。

要約(オリジナル)

Semantic segmentation is crucial in remote sensing, where high-resolution satellite images are segmented into meaningful regions. Recent advancements in deep learning have significantly improved satellite image segmentation. However, most of these methods are typically trained in fully supervised settings that require high-quality pixel-level annotations, which are expensive and time-consuming to obtain. In this work, we present a weakly supervised learning algorithm to train semantic segmentation algorithms that only rely on query point annotations instead of full mask labels. Our proposed approach performs accurate semantic segmentation and improves efficiency by significantly reducing the cost and time required for manual annotation. Specifically, we generate superpixels and extend the query point labels into those superpixels that group similar meaningful semantics. Then, we train semantic segmentation models, supervised with images partially labeled with the superpixels pseudo-labels. We benchmark our weakly supervised training approach on an aerial image dataset and different semantic segmentation architectures, showing that we can reach competitive performance compared to fully supervised training while reducing the annotation effort.

arxiv情報

著者 Santiago Rivier,Carlos Hinojosa,Silvio Giancola,Bernard Ghanem
発行日 2023-09-11 14:32:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク