要約
タイトル:最近のFew-Shot Object Detectionアルゴリズム:パフォーマンス比較を伴うサーベイ
要約:
– ジェネリックオブジェクト検出(GOD)タスクは、いくつかの共通のクラスからの大量の注釈付きトレーニングサンプルで訓練された最近のディープニューラルネットワークによって成功裏に解決されています。
– ただし、これらのオブジェクト検出器を、わずかなラベル付きトレーニングサンプルしかない新しい長尾のオブジェクトクラスに汎化することは依然として非常に困難です。
– そのため、Few-Shot Object Detection(FSOD)が最近注目を集めており、それは学習するための人間の能力を模倣し、共通のヘビーテールドから新しい長尾のオブジェクトクラスに知識を転移することができます。
– 特に、この新興分野の研究は、様々なベンチマーク、バックボーン、および方法論から成る最近の成果について実施された包括的なサーベイが行われており、fine-tuning/transfer learningとmeta-learning方法のグループとしてシステマチックに比較されているいくつかの洞察に富むFSODサーベイ記事[58, 59, 74, 78]があります。
– 対照的に、我々は、その貢献に基づいた新しい分類法に基づく新しい視点から、既存のFSODアルゴリズムを見直しています。つまり、データ指向、モデル指向、アルゴリズム指向の3つのタイプにFSODの方法をグループ化しています。
– これに従って、FSODの進歩に関する包括的なサーベイが実施され、パフォーマンスの比較、これらの方法の技術的課題、長所と短所、FSODの将来の方向について分析しています。具体的には、FSODの概要、問題定義、共通のデータセット、評価プロトコルについて概説し、FSODの進歩についてシステマティックにレビューします。最後に、パフォーマンス、課題、将来の方向に関するさらなる議論が提示されます。
要約(オリジナル)
The generic object detection (GOD) task has been successfully tackled by recent deep neural networks, trained by an avalanche of annotated training samples from some common classes. However, it is still non-trivial to generalize these object detectors to the novel long-tailed object classes, which have only few labeled training samples. To this end, the Few-Shot Object Detection (FSOD) has been topical recently, as it mimics the humans’ ability of learning to learn, and intelligently transfers the learned generic object knowledge from the common heavy-tailed, to the novel long-tailed object classes. Especially, the research in this emerging field has been flourishing in recent years with various benchmarks, backbones, and methodologies proposed. To review these FSOD works, there are several insightful FSOD survey articles [58, 59, 74, 78] that systematically study and compare them as the groups of fine-tuning/transfer learning, and meta-learning methods. In contrast, we review the existing FSOD algorithms from a new perspective under a new taxonomy based on their contributions, i.e., data-oriented, model-oriented, and algorithm-oriented. Thus, a comprehensive survey with performance comparison is conducted on recent achievements of FSOD. Furthermore, we also analyze the technical challenges, the merits and demerits of these methods, and envision the future directions of FSOD. Specifically, we give an overview of FSOD, including the problem definition, common datasets, and evaluation protocols. The taxonomy is then proposed that groups FSOD methods into three types. Following this taxonomy, we provide a systematic review of the advances in FSOD. Finally, further discussions on performance, challenges, and future directions are presented.
arxiv情報
| 著者 | Tianying Liu,Lu Zhang,Yang Wang,Jihong Guan,Yanwei Fu,Jiajia Zhao,Shuigeng Zhou | 
| 発行日 | 2023-04-12 05:26:58+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, OpenAI
