IDiff-Face: Synthetic-based Face Recognition through Fizzy Identity-Conditioned Diffusion Models

要約

大規模な本物の顔データベースの利用可能性は、過去 10 年間の顔認識研究の大幅な進歩にとって極めて重要でした。
しかし、法的および倫理的な懸念により、最近これらのデータベースの多くが作成者によって撤回され、重要なリソースの 1 つがなければ、将来の顔認識研究の継続性に疑問が生じています。
合成データセットは、顔認識開発におけるプライバシーに配慮した本物のデータに代わる有望な代替手段として浮上しています。
ただし、顔認識モデルのトレーニングに使用される最近の合成データセットは、クラス内の多様性またはクラス間 (アイデンティティ) 識別の制限のいずれかに悩まされており、精度が最適化されず、本物のデータでトレーニングされたモデルによって達成される精度からは遠く離れています。
この論文は、顔認識トレーニングのための現実的なアイデンティティのバリエーションを備えた合成アイデンティティ生成のための条件付き潜在拡散モデルに基づく新しいアプローチである IDiff-Face を提案することで、この問題をターゲットにしています。
広範な評価を通じて、私たちが提案した合成ベースの顔認識アプローチは、最先端のパフォーマンスの限界を押し広げ、たとえば、Labeled Faces in the Wild (LFW) ベンチマークでは、最近のベンチマークをはるかに上回る 98.00% の精度を達成しました。
合成ベースの顔認識ソリューションの精度は 95.40% で、本物ベースの顔認識の精度は 99.82% です。

要約(オリジナル)

The availability of large-scale authentic face databases has been crucial to the significant advances made in face recognition research over the past decade. However, legal and ethical concerns led to the recent retraction of many of these databases by their creators, raising questions about the continuity of future face recognition research without one of its key resources. Synthetic datasets have emerged as a promising alternative to privacy-sensitive authentic data for face recognition development. However, recent synthetic datasets that are used to train face recognition models suffer either from limitations in intra-class diversity or cross-class (identity) discrimination, leading to less optimal accuracies, far away from the accuracies achieved by models trained on authentic data. This paper targets this issue by proposing IDiff-Face, a novel approach based on conditional latent diffusion models for synthetic identity generation with realistic identity variations for face recognition training. Through extensive evaluations, our proposed synthetic-based face recognition approach pushed the limits of state-of-the-art performances, achieving, for example, 98.00% accuracy on the Labeled Faces in the Wild (LFW) benchmark, far ahead from the recent synthetic-based face recognition solutions with 95.40% and bridging the gap to authentic-based face recognition with 99.82% accuracy.

arxiv情報

著者 Fadi Boutros,Jonas Henry Grebe,Arjan Kuijper,Naser Dame
発行日 2023-08-09 14:48:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク