要約
実際のアプリケーションではラベル付けされたデータのコストがかかるため、疑似ラベル付けに支えられた半教師ありオブジェクト検出器は魅力的です。
ただし、紛らわしいサンプルの処理は簡単ではありません。貴重な紛らわしいサンプルを破棄すると、モデルの一般化が損なわれ、トレーニングに使用すると、不可避の誤ったラベル付けによって引き起こされる確証バイアスの問題が悪化します。
この問題を解決するために、この論文では、ラベルを修正せずに、紛らわしいサンプルを積極的に使用することを提案します。
具体的には、仮想カテゴリ(VC)が各紛らわしいサンプルに割り当てられ、具体的なラベルがなくてもモデルの最適化に安全に貢献できるようになっています。
これは、トレーニングサンプルと仮想カテゴリ間の埋め込み距離をクラス間距離の下限として指定したためです。
さらに、位置回帰の高品質な境界を可能にするために、ローカリゼーション損失も変更します。
広範な実験は、提案されたVC学習が、特に少量の利用可能なラベルで、最先端を大幅に上回っていることを示しています。
要約(オリジナル)
Due to the costliness of labelled data in real-world applications, semi-supervised object detectors, underpinned by pseudo labelling, are appealing. However, handling confusing samples is nontrivial: discarding valuable confusing samples would compromise the model generalisation while using them for training would exacerbate the confirmation bias issue caused by inevitable mislabelling. To solve this problem, this paper proposes to use confusing samples proactively without label correction. Specifically, a virtual category (VC) is assigned to each confusing sample such that they can safely contribute to the model optimisation even without a concrete label. It is attributed to specifying the embedding distance between the training sample and the virtual category as the lower bound of the inter-class distance. Moreover, we also modify the localisation loss to allow high-quality boundaries for location regression. Extensive experiments demonstrate that the proposed VC learning significantly surpasses the state-of-the-art, especially with small amounts of available labels.
arxiv情報
著者 | Changrui Chen,Kurt Debattista,Jungong Han |
発行日 | 2022-07-07 16:59:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google