要約
顔認識は、損失関数の進歩とトレーニング セットのサイズの爆発的な増加により、近年大きな進歩を遂げました。
適切に設計された損失は、分類のための識別機能を抽出するための鍵と見なされます。
顔認識におけるソフトマックス損失の代替として、いくつかのマージンベースの損失が提案されています。
ただし、考慮すべき 2 つの問題が残っています。1) 識別学習のためのハード サンプル マイニングの重要性を見落としています。
2) ラベル ノイズは大規模なデータセットに遍在し、モデルのパフォーマンスに深刻なダメージを与える可能性があります。
この論文では、決定境界の観点から始めて、サンプルのグラウンド トゥルース クラス センターとその最も近いネガティブ クラス センターとの関係に焦点を当てた新しいマイニング フレームワークを提案します。
具体的には、クローズド セット ノイズ ラベル自己修正モジュールが提唱され、このフレームワークは多くのラベル ノイズを含むデータセットでうまく機能します。
提案された方法は、さまざまな顔認識ベンチマークで SOTA 方法よりも一貫して優れています。
トレーニング コードは https://github.com/SWJTU-3DVision/BoundaryFace で公開されています。
要約(オリジナル)
Face recognition has made tremendous progress in recent years due to the advances in loss functions and the explosive growth in training sets size. A properly designed loss is seen as key to extract discriminative features for classification. Several margin-based losses have been proposed as alternatives of softmax loss in face recognition. However, two issues remain to consider: 1) They overlook the importance of hard sample mining for discriminative learning. 2) Label noise ubiquitously exists in large-scale datasets, which can seriously damage the model’s performance. In this paper, starting from the perspective of decision boundary, we propose a novel mining framework that focuses on the relationship between a sample’s ground truth class center and its nearest negative class center. Specifically, a closed-set noise label self-correction module is put forward, making this framework work well on datasets containing a lot of label noise. The proposed method consistently outperforms SOTA methods in various face recognition benchmarks. Training code has been released at https://github.com/SWJTU-3DVision/BoundaryFace.
arxiv情報
著者 | Shijie Wu,Xun Gong |
発行日 | 2022-10-10 11:12:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google