要約
自動顔認識システムのパフォーマンスは、必然的に顔の老化プロセスの影響を受けます。
ただし、数年間にわたって収集された個人の高品質なデータセットは、通常、規模が小さいです。
この研究では、顔画像を合成的に老化および老化防止するための潜在的なテキストから画像への拡散モデルの使用を提案、トレーニング、および検証します。
私たちのモデルは数ショットのトレーニングで成功し、直感的なテキストのプロンプトによって制御できるという追加の利点もあります。
一般的に使用される測定基準によって測定される生体認証の忠実度を維持しながら、生成された画像で高度な視覚的リアリズムが観察されます。
2 つのベンチマーク データセット (CelebA と AgeDB) でメソッドを評価し、既存の最先端のベースラインと比較して誤った不一致率が大幅に減少 (~44%) していることが観察されました。
要約(オリジナル)
The performance of automated face recognition systems is inevitably impacted by the facial aging process. However, high quality datasets of individuals collected over several years are typically small in scale. In this work, we propose, train, and validate the use of latent text-to-image diffusion models for synthetically aging and de-aging face images. Our models succeed with few-shot training, and have the added benefit of being controllable via intuitive textual prompting. We observe high degrees of visual realism in the generated images while maintaining biometric fidelity measured by commonly used metrics. We evaluate our method on two benchmark datasets (CelebA and AgeDB) and observe significant reduction (~44%) in the False Non-Match Rate compared to existing state-of the-art baselines.
arxiv情報
著者 | Sudipta Banerjee,Govind Mittal,Ameya Joshi,Chinmay Hegde,Nasir Memon |
発行日 | 2023-07-17 15:57:52+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google