Classification Committee for Active Deep Object Detection

要約

物体検出では、画像内の複数の物体のカテゴリを確認するだけでなく、各物体の境界ボックスを正確に決定する必要があるため、ラベル付けのコストが非常に高くなります。
したがって、アクティブ ラーニングを物体検出に統合することは、かなり前向きな意義をもたらします。
この論文では、物体検出器を訓練する際のサンプル選択に複数の分類器の不一致メカニズムを導入することにより、アクティブな深層物体検出方法のための分類委員会を提案します。
モデルには、メイン検出器と分類委員会が含まれています。
メイン検出器は、選択された情報画像で構成されるラベル付きプールからトレーニングされたターゲット オブジェクト検出器を指します。
分類委員会の役割は、分類の観点から不確実性の値に応じて最も有益な画像を選択することであり、不一致とインスタンスの代表性により重点を置くことが期待されます。
具体的には、提案された最大分類子不一致グループ損失 (MCDGL) によって事前トレーニングされた委員会によって出力された不一致を測定することにより、画像内の指定されたインスタンスの不確実性を計算します。
最も有益な画像は、不確実性の高いインスタンスが多数含まれる画像を選択することによって最終的に決定されます。
さらに、干渉インスタンスの影響を軽減するために、Positive Instances Loss (FPIL) を設計し、委員会が自動的に代表的なインスタンスに焦点を当て、同じインスタンスの不一致を正確にエンコードできるようにします。
実験は、Pascal VOC および COCO データセットといくつかの一般的なオブジェクト検出器に対して行われます。
そして結果は、私たちの方法が最先端のアクティブラーニング方法よりも優れていることを示しており、提案された方法の有効性が実証されています。

要約(オリジナル)

In object detection, the cost of labeling is much high because it needs not only to confirm the categories of multiple objects in an image but also to accurately determine the bounding boxes of each object. Thus, integrating active learning into object detection will raise pretty positive significance. In this paper, we propose a classification committee for active deep object detection method by introducing a discrepancy mechanism of multiple classifiers for samples’ selection when training object detectors. The model contains a main detector and a classification committee. The main detector denotes the target object detector trained from a labeled pool composed of the selected informative images. The role of the classification committee is to select the most informative images according to their uncertainty values from the view of classification, which is expected to focus more on the discrepancy and representative of instances. Specifically, they compute the uncertainty for a specified instance within the image by measuring its discrepancy output by the committee pre-trained via the proposed Maximum Classifiers Discrepancy Group Loss (MCDGL). The most informative images are finally determined by selecting the ones with many high-uncertainty instances. Besides, to mitigate the impact of interference instances, we design a Focus on Positive Instances Loss (FPIL) to make the committee the ability to automatically focus on the representative instances as well as precisely encode their discrepancies for the same instance. Experiments are conducted on Pascal VOC and COCO datasets versus some popular object detectors. And results show that our method outperforms the state-of-the-art active learning methods, which verifies the effectiveness of the proposed method.

arxiv情報

著者 Lei Zhao,Bo Li,Xingxing Wei
発行日 2023-08-16 16:31:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク