Detecting the unknown in Object Detection

要約

物体検出方法は、斬新なニューラル ネットワーク アーキテクチャの設計と大規模なデータセットの利用可能性のおかげで、ここ数年で目覚ましい改善を目の当たりにしました。
ただし、現在の方法には重大な制限があります。トレーニング時に観察されたクラスのみを検出できます。これは、検出器が現実の世界で遭遇する可能性のあるすべてのクラスのサブセットにすぎません。
さらに、未知のクラスの存在はトレーニング時に考慮されないことが多く、その結果、未知のオブジェクトが画像内に存在することを検出することさえできません。
この作業では、オープン セット オブジェクト検出として知られている未知のオブジェクトを検出する問題に対処します。
UNKAD と呼ばれる新しいトレーニング戦略を提案します。これは、トレーニング画像の背景に既に存在するアノテーションのないオブジェクトを利用して、未知のオブジェクトにアノテーションを必要とせずに予測することができます。
特に、Faster R-CNN の 4 ステップのトレーニング戦略を利用して、UNKAD は最初に未知のオブジェクトを識別して疑似ラベルを付け、次に疑似アノテーションを使用して追加の未知のクラスをトレーニングします。
UNKAD は未知のオブジェクトを直接検出できますが、それを以前の未知の検出技術とさらに組み合わせて、コストをかけずにパフォーマンスを向上させることを示しています。

要約(オリジナル)

Object detection methods have witnessed impressive improvements in the last years thanks to the design of novel neural network architectures and the availability of large scale datasets. However, current methods have a significant limitation: they are able to detect only the classes observed during training time, that are only a subset of all the classes that a detector may encounter in the real world. Furthermore, the presence of unknown classes is often not considered at training time, resulting in methods not even able to detect that an unknown object is present in the image. In this work, we address the problem of detecting unknown objects, known as open-set object detection. We propose a novel training strategy, called UNKAD, able to predict unknown objects without requiring any annotation of them, exploiting non annotated objects that are already present in the background of training images. In particular, exploiting the four-steps training strategy of Faster R-CNN, UNKAD first identifies and pseudo-labels unknown objects and then uses the pseudo-annotations to train an additional unknown class. While UNKAD can directly detect unknown objects, we further combine it with previous unknown detection techniques, showing that it improves their performance at no costs.

arxiv情報

著者 Dario Fontanel,Matteo Tarantino,Fabio Cermelli,Barbara Caputo
発行日 2022-08-24 16:27:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク