Virtual Category Learning: A Semi-Supervised Learning Method for Dense Prediction with Extremely Limited Labels

要約

実世界のアプリケーションではラベル付きデータは高価であるため、擬似ラベル付けによって裏付けられた半教師あり学習は魅力的なソリューションです。
ただし、紛らわしいサンプルの処理は簡単ではありません。貴重な紛らわしいサンプルを破棄すると、モデルの一般化が損なわれる一方、それらをトレーニングに使用すると、必然的に生じる誤ったラベル付けによって引き起こされる確証バイアスの問題が悪化します。
この問題を解決するために、本論文では、ラベル修正を行わずに、紛らわしいサンプルを積極的に使用することを提案します。
具体的には、仮想カテゴリ (VC) が、具体的なラベルがなくてもモデルの最適化に安全に貢献できるような方法で、混乱を招く各サンプルに割り当てられます。
これにより、クラス間の情報共有容量に上限が設けられ、最終的にはより良い埋め込みスペースが得られます。
セマンティック セグメンテーションとオブジェクト検出という 2 つの主流の高密度予測タスクに関する広範な実験により、特にラベルが非常に少ない場合に、提案された VC 学習が最先端技術を大幅に上回ることが実証されました。
私たちの興味深い発見は、高密度視覚タスクにおける VC 学習の使用法を強調しています。

要約(オリジナル)

Due to the costliness of labelled data in real-world applications, semi-supervised learning, underpinned by pseudo labelling, is an appealing solution. However, handling confusing samples is nontrivial: discarding valuable confusing samples would compromise the model generalisation while using them for training would exacerbate the issue of confirmation bias caused by the resulting inevitable mislabelling. To solve this problem, this paper proposes to use confusing samples proactively without label correction. Specifically, a Virtual Category (VC) is assigned to each confusing sample in such a way that it can safely contribute to the model optimisation even without a concrete label. This provides an upper bound for inter-class information sharing capacity, which eventually leads to a better embedding space. Extensive experiments on two mainstream dense prediction tasks — semantic segmentation and object detection, demonstrate that the proposed VC learning significantly surpasses the state-of-the-art, especially when only very few labels are available. Our intriguing findings highlight the usage of VC learning in dense vision tasks.

arxiv情報

著者 Changrui Chen,Jungong Han,Kurt Debattista
発行日 2024-02-12 12:59:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク