RepFace: Refining Closed-Set Noise with Progressive Label Correction for Face Recognition

要約

顔認識は、データセットの規模の拡大、さまざまなバックボーンの進歩、および識別損失によって目覚ましい進歩を遂げています。
ただし、顔認識のパフォーマンスはラベル ノイズ、特に閉集合ノイズに大きく影響されます。
多くの研究がラベル ノイズの処理に焦点を当ててきましたが、閉集合ノイズへの対処には依然として課題が残されています。
この論文では、トレーニングの初期段階ではトレーニングがノイズに対して堅牢ではなく、後のトレーニング段階で閉集合ノイズとして誤分類されることが多い、信頼性の低いサンプルに対する適切な学習戦略が必要であるため、この課題を特定しています。
これらの問題に対処するために、初期段階でトレーニングを安定させ、サンプルを別々のトレーニング戦略で考案されたクリーンなグループ、あいまいなグループ、ノイズの多いグループに分割するための新しいフレームワークを提案します。
最初に、生成された補助的な閉集合のノイズのあるサンプルを使用して、モデルがトレーニングの初期段階でノイズのあるデータを識別できるようにします。
続いて、サンプルが陽性中心と最も近い陰性中心との類似性によって、クリーンなグループ、あいまいなグループ、ノイズの多いグループにどのように分割されるかを紹介します。
次に、蓄積されたモデル予測を組み込むことにより、あいまいなサンプルのラベル融合を実行します。
最後に、閉じたセット内でラベルの平滑化を適用し、最も近い負のクラスと最初に割り当てられたラベルの間の点にラベルを調整します。
広範な実験により、主流の顔データセットに対する私たちの手法の有効性が検証され、最先端の結果が得られました。
コードは承認され次第公開されます。

要約(オリジナル)

Face recognition has made remarkable strides, driven by the expanding scale of datasets, advancements in various backbone and discriminative losses. However, face recognition performance is heavily affected by the label noise, especially closed-set noise. While numerous studies have focused on handling label noise, addressing closed-set noise still poses challenges. This paper identifies this challenge as training isn’t robust to noise at the early-stage training, and necessitating an appropriate learning strategy for samples with low confidence, which are often misclassified as closed-set noise in later training phases. To address these issues, we propose a new framework to stabilize the training at early stages and split the samples into clean, ambiguous and noisy groups which are devised with separate training strategies. Initially, we employ generated auxiliary closed-set noisy samples to enable the model to identify noisy data at the early stages of training. Subsequently, we introduce how samples are split into clean, ambiguous and noisy groups by their similarity to the positive and nearest negative centers. Then we perform label fusion for ambiguous samples by incorporating accumulated model predictions. Finally, we apply label smoothing within the closed set, adjusting the label to a point between the nearest negative class and the initially assigned label. Extensive experiments validate the effectiveness of our method on mainstream face datasets, achieving state-of-the-art results. The code will be released upon acceptance.

arxiv情報

著者 Jie Zhang,Xun Gong,Zhonglin Sun
発行日 2024-12-16 17:57:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク