W2N:Switching From Weak Supervision to Noisy Supervision for Object Detection

要約

弱く監視されたオブジェクト検出(WSOD)は、画像レベルの注釈のみを必要とするオブジェクト検出器をトレーニングすることを目的としています。
最近、いくつかの作業では、十分にトレーニングされたWSODネットワークから生成された正確なボックスを選択して、パフォーマンスを向上させるために半教師あり検出フレームワークを監視することに成功しました。
ただし、これらのアプローチでは、トレーニングセットを画像レベルの基準に従ってラベル付きセットとラベルなしセットに分割するだけで、十分なラベルの誤りまたは誤ってローカライズされたボックス予測が疑似グラウンドトゥルースとして選択され、検出パフォーマンスの最適なソリューションが得られません。
この問題を克服するために、弱い監視からノイズの多い監視(W2N)に切り替える新しいパラダイムを備えた新しいWSODフレームワークを提案します。
一般に、十分にトレーニングされたWSODネットワークから生成された疑似グラウンドトゥルースを使用して、疑似ラベルを改良し、より優れたオブジェクト検出器を段階的に監視する2モジュールの反復トレーニングアルゴリズムを提案します。
ローカリゼーション適応モジュールでは、元の疑似グラウンドトゥルースの識別部分の割合を減らし、さらなるトレーニングのためにより良い疑似グラウンドトゥルースを取得するための正則化損失を提案します。
半教師ありモジュールでは、半教師あり検出器をトレーニングするための高品質のラベルを選択するために、2つのタスクのインスタンスレベルの分割方法を提案します。
さまざまなベンチマークでの実験結果により、W2Nの有効性が検証され、W2Nは既存のすべての純粋なWSODメソッドおよび転移学習メソッドよりも優れています。
私たちのコードはhttps://github.com/1170300714/w2n_wsodで公開されています。

要約(オリジナル)

Weakly-supervised object detection (WSOD) aims to train an object detector only requiring the image-level annotations. Recently, some works have managed to select the accurate boxes generated from a well-trained WSOD network to supervise a semi-supervised detection framework for better performance. However, these approaches simply divide the training set into labeled and unlabeled sets according to the image-level criteria, such that sufficient mislabeled or wrongly localized box predictions are chosen as pseudo ground-truths, resulting in a sub-optimal solution of detection performance. To overcome this issue, we propose a novel WSOD framework with a new paradigm that switches from weak supervision to noisy supervision (W2N). Generally, with given pseudo ground-truths generated from the well-trained WSOD network, we propose a two-module iterative training algorithm to refine pseudo labels and supervise better object detector progressively. In the localization adaptation module, we propose a regularization loss to reduce the proportion of discriminative parts in original pseudo ground-truths, obtaining better pseudo ground-truths for further training. In the semi-supervised module, we propose a two tasks instance-level split method to select high-quality labels for training a semi-supervised detector. Experimental results on different benchmarks verify the effectiveness of W2N, and our W2N outperforms all existing pure WSOD methods and transfer learning methods. Our code is publicly available at https://github.com/1170300714/w2n_wsod.

arxiv情報

著者 Zitong Huang,Yiping Bao,Bowen Dong,Erjin Zhou,Wangmeng Zuo
発行日 2022-07-25 12:13:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク