Towards Few-Shot Open-Set Object Detection

要約

オープン セット オブジェクト検出 (OSOD) は、動的な世界で既知のカテゴリを検出し、未知のオブジェクトを識別することを目的としており、大きな注目を集めています。
ただし、以前のアプローチは、データが豊富な状況でのみこの問題を考慮しています。
既知のすべてのクラスを検出し、未知のクラスを識別しながら、少数のサンプルに基づいて検出器を迅速にトレーニングすることを目的とした少数ショット オープン セット オブジェクト検出 (FSOSOD) のソリューションを探します。
このタスクの主な課題は、ほとんどのトレーニング サンプルが既知のクラスにオーバーフィットする傾向があり、オープン セットのパフォーマンスが低下することです。
この問題に取り組むために、FOOD という名前の新しい FSOSOD アルゴリズムを提案します。このアルゴリズムには、新しいクラス ドロップアウト コサイン分類器 (CDCC) と新しい未知の分離学習器 (UDL) が含まれています。
オーバーフィッティングを防ぐために、CDCC はすべてのクラスのロジット予測のために正規化されたニューロンの一部をランダムに不活性化し、クラスとその近隣の相互適応性を低下させます。
同時に、UDL は未知のクラスのトレーニングを分離し、モデルがコンパクトな未知の決定境界を形成できるようにします。
したがって、未知のオブジェクトは、トレーニング用の疑似未知サンプルなしで信頼確率で識別できます。
数ショットのシーンでいくつかの最先端の OSOD メソッドと私たちの方法を比較し、私たちの方法が VOC-COCO データセット設定のすべてのショットで未知のクラスの再現率を 5%-9% 改善することを観察します。

要約(オリジナル)

Open-set object detection (OSOD) aims to detect the known categories and identify unknown objects in a dynamic world, which has achieved significant attentions. However, previous approaches only consider this problem in data-abundant conditions. We seek a solution for few-shot open-set object detection (FSOSOD), which aims to quickly train a detector based on few samples while detecting all known classes and identifying unknown classes. The main challenge for this task is that few training samples tend to overfit on the known classes, and lead to poor open-set performance. We propose a new FSOSOD algorithm to tackle this issue, named FOOD, which contains a novel class dropout cosine classifier (CDCC) and a novel unknown decoupling learner (UDL). To prevent over-fitting, CDCC randomly inactivates parts of the normalized neurons for the logit prediction of all classes, and then decreases the co-adaptability between the class and its neighbors. Alongside, UDL decouples training the unknown class and enables the model to form a compact unknown decision boundary. Thus, the unknown objects can be identified with a confidence probability without any pseudo-unknown samples for training. We compare our method with several state-of-the-art OSOD methods in few-shot scenes and observe that our method improves the recall of unknown classes by 5%-9% across all shots in VOC-COCO dataset setting.

arxiv情報

著者 Binyi Su,Hua Zhang,Zhong Zhou
発行日 2022-10-28 09:02:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク