Few Shot Semantic Segmentation: a review of methodologies, benchmarks, and open challenges


セマンティック セグメンテーションは、自動運転からロボット工学に至るまでのアプリケーションにとって不可欠ですが、大規模な注釈付きデータセットの収集が困難または法外に高価な領域では、重大な課題に直面しています。
コンピューター ビジョンにおける新しいタスクである Few-Shot セマンティック セグメンテーションの紹介。これは、ほんの数例で新しいセマンティック クラスをセグメント化できるモデルを設計することを目的としています。
この論文は、フューショット セマンティック セグメンテーションの包括的な調査で構成され、その進化を追跡し、より一般的な条件付きネットワークやプロトタイプ ネットワークからよりニッチな潜在空間最適化手法に至るまで、さまざまなモデル設計を調査し、最近の基礎モデルが提供する新しい機会も示します。

この調査は、ベンチマーク データセットの定量的分析と独創的な作品の定性的ショーケースによって補完され、読者にこのトピックについての深い理解を提供します。
現在の課題、最先端のモデル、展望を解明することで、研究者や実践者がフューショット セマンティック セグメンテーションの複雑な問題を解決できるように支援し、将来の開発のための基盤を提供します。


Semantic segmentation, vital for applications ranging from autonomous driving to robotics, faces significant challenges in domains where collecting large annotated datasets is difficult or prohibitively expensive. In such contexts, such as medicine and agriculture, the scarcity of training images hampers progress. Introducing Few-Shot Semantic Segmentation, a novel task in computer vision, which aims at designing models capable of segmenting new semantic classes with only a few examples. This paper consists of a comprehensive survey of Few-Shot Semantic Segmentation, tracing its evolution and exploring various model designs, from the more popular conditional and prototypical networks to the more niche latent space optimization methods, presenting also the new opportunities offered by recent foundational models. Through a chronological narrative, we dissect influential trends and methodologies, providing insights into their strengths and limitations. A temporal timeline offers a visual roadmap, marking key milestones in the field’s progression. Complemented by quantitative analyses on benchmark datasets and qualitative showcases of seminal works, this survey equips readers with a deep understanding of the topic. By elucidating current challenges, state-of-the-art models, and prospects, we aid researchers and practitioners in navigating the intricacies of Few-Shot Semantic Segmentation and provide ground for future development.


著者 Nico Catalano,Matteo Matteucci
発行日 2024-05-20 13:55:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク