Beyond Few-shot Object Detection: A Detailed Survey

要約

物体検出は、画像やビデオ内の特定の物体を正確に識別して位置を特定することに焦点を当てた、コンピューター ビジョンの重要な分野です。
従来の物体検出方法は、物体カテゴリごとにラベル付けされた大規模なトレーニング データセットに依存しており、収集と注釈付けに時間と費用がかかる場合があります。
この問題に対処するために、研究者らは、少数ショット学習と物体検出原理を統合した少数ショット物体検出 (FSOD) アプローチを導入しました。
これらのアプローチにより、モデルは注釈付きサンプルがわずか数個だけで、新しいオブジェクト カテゴリに迅速に適応できます。
従来の FSOD 手法はこれまでも研究されてきましたが、この調査論文では、標準 FSOD、一般化 FSOD、増分 FSOD、オープンセット FSOD、ドメイン適応型 FSOD などのさまざまな FSOD 設定をカバーすることに特に焦点を当てて、FSOD 研究を包括的にレビューしています。
これらのアプローチは、特に効率的な機械学習モデルのニーズが高まり続ける中で、大規模なラベル付きデータセットへの依存を軽減する上で重要な役割を果たします。
この調査ペーパーは、上記の少数ショット設定を包括的に理解し、各 FSOD タスクの方法論を探ることを目的としています。
さまざまな FSOD 設定にわたる最先端の手法を徹底的に比較し、評価プロトコルに基づいて詳細に分析します。
さらに、限られたデータで進化する物体検出分野におけるアプリケーション、課題、潜在的な将来の方向性についての洞察を提供します。

要約(オリジナル)

Object detection is a critical field in computer vision focusing on accurately identifying and locating specific objects in images or videos. Traditional methods for object detection rely on large labeled training datasets for each object category, which can be time-consuming and expensive to collect and annotate. To address this issue, researchers have introduced few-shot object detection (FSOD) approaches that merge few-shot learning and object detection principles. These approaches allow models to quickly adapt to new object categories with only a few annotated samples. While traditional FSOD methods have been studied before, this survey paper comprehensively reviews FSOD research with a specific focus on covering different FSOD settings such as standard FSOD, generalized FSOD, incremental FSOD, open-set FSOD, and domain adaptive FSOD. These approaches play a vital role in reducing the reliance on extensive labeled datasets, particularly as the need for efficient machine learning models continues to rise. This survey paper aims to provide a comprehensive understanding of the above-mentioned few-shot settings and explore the methodologies for each FSOD task. It thoroughly compares state-of-the-art methods across different FSOD settings, analyzing them in detail based on their evaluation protocols. Additionally, it offers insights into their applications, challenges, and potential future directions in the evolving field of object detection with limited data.

arxiv情報

著者 Vishal Chudasama,Hiran Sarkar,Pankaj Wasnik,Vineeth N Balasubramanian,Jayateja Kalla
発行日 2024-08-26 13:09:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, I.2.10 パーマリンク