要約
ディープ顔認識の最近の進歩により、手動で注釈が付けられた大規模で多様な顔データセットに対する需要が高まっています。
顔認識用の本物の高品質データを取得することは、主にプライバシー上の懸念により、困難であることが判明しています。
大規模な顔データセットは主に Web ベースの画像から取得されており、ユーザーの明示的な同意がありません。
この論文では、合成顔データを使用して、本物の画像への依存を減らして効果的な顔認識モデルをトレーニングできるかどうか、またその方法を検討して、データ収集の懸念を軽減します。
まず、合成データのみと本物の (希少な) データのみを使用してトレーニングされた、最近の最先端の顔認識モデル間のパフォーマンスのギャップを調査しました。
次に、合成データと本物のデータをさまざまに組み合わせて最先端のバックボーンをトレーニングすることで分析を深め、検証精度を高めるために後者の限定的な使用を最適化するための洞察を得ました。
最後に、同じ目標を念頭に置いて、合成データと本物のデータに対するデータ拡張アプローチの有効性を評価しました。
私たちの結果は、特に適切な拡張技術と組み合わせた場合、結合されたデータセットでトレーニングされた FR の有効性を強調しました。
要約(オリジナル)
Recent advances in deep face recognition have spurred a growing demand for large, diverse, and manually annotated face datasets. Acquiring authentic, high-quality data for face recognition has proven to be a challenge, primarily due to privacy concerns. Large face datasets are primarily sourced from web-based images, lacking explicit user consent. In this paper, we examine whether and how synthetic face data can be used to train effective face recognition models with reduced reliance on authentic images, thereby mitigating data collection concerns. First, we explored the performance gap among recent state-of-the-art face recognition models, trained with synthetic data only and authentic (scarce) data only. Then, we deepened our analysis by training a state-of-the-art backbone with various combinations of synthetic and authentic data, gaining insights into optimizing the limited use of the latter for verification accuracy. Finally, we assessed the effectiveness of data augmentation approaches on synthetic and authentic data, with the same goal in mind. Our results highlighted the effectiveness of FR trained on combined datasets, particularly when combined with appropriate augmentation techniques.
arxiv情報
著者 | Andrea Atzori,Fadi Boutros,Naser Damer,Gianni Fenu,Mirko Marras |
発行日 | 2024-04-26 14:01:36+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google