要約
文献で提案されている最近の深顔認識モデルは、MS-Celeb-1MやVGGFace2などの大規模な公開データセットを利用して非常に深いニューラルネットワークをトレーニングし、主流のベンチマークで最先端のパフォーマンスを実現しました。
最近、これらのデータセットの多く(MS-Celeb-1MやVGGFace2など)は、信頼できるプライバシーと倫理的懸念のために撤回されました。
これにより、この作業は、プライバシーに配慮した合成で生成された顔データセットを使用して顔認識モデルをトレーニングすることの実現可能性を提案および調査するようになります。
この目的に向けて、クラス条件付きの生成的敵対的ネットワークを利用して、クラスラベル付きの合成顔画像、つまりSFaceを生成します。
このようなデータを使用して顔認識モデルをトレーニングすることのプライバシーの側面に対処するために、合成データセットと生成モデルのトレーニングに使用された元の本物のデータセットとの間の同一性関係に関する広範な評価実験を提供します。
報告された評価では、本物のデータセットのIDを、合成データセット内の同じクラスラベルを持つIDに関連付けることはほとんど不可能であることが証明されました。
また、プライバシーに配慮したデータセットSFaceで、3つの異なる学習戦略、マルチクラス分類、ラベルフリーの知識伝達、およびマルチクラス分類と知識伝達の組み合わせ学習を使用して、顔認識をトレーニングすることを提案します。
5つの本物の顔ベンチマークで報告された評価結果は、プライバシーに優しい合成データセットが顔認識モデルのトレーニングに使用される可能性が高く、たとえば、マルチクラス分類と99.13を使用したLFWで91.87 \%の検証精度を達成することを示しました。
\%複合学習戦略を使用します。
要約(オリジナル)
Recent deep face recognition models proposed in the literature utilized large-scale public datasets such as MS-Celeb-1M and VGGFace2 for training very deep neural networks, achieving state-of-the-art performance on mainstream benchmarks. Recently, many of these datasets, e.g., MS-Celeb-1M and VGGFace2, are retracted due to credible privacy and ethical concerns. This motivates this work to propose and investigate the feasibility of using a privacy-friendly synthetically generated face dataset to train face recognition models. Towards this end, we utilize a class-conditional generative adversarial network to generate class-labeled synthetic face images, namely SFace. To address the privacy aspect of using such data to train a face recognition model, we provide extensive evaluation experiments on the identity relation between the synthetic dataset and the original authentic dataset used to train the generative model. Our reported evaluation proved that associating an identity of the authentic dataset to one with the same class label in the synthetic dataset is hardly possible. We also propose to train face recognition on our privacy-friendly dataset, SFace, using three different learning strategies, multi-class classification, label-free knowledge transfer, and combined learning of multi-class classification and knowledge transfer. The reported evaluation results on five authentic face benchmarks demonstrated that the privacy-friendly synthetic dataset has high potential to be used for training face recognition models, achieving, for example, a verification accuracy of 91.87\% on LFW using multi-class classification and 99.13\% using the combined learning strategy.
arxiv情報
著者 | Fadi Boutros,Marco Huber,Patrick Siebke,Tim Rieber,Naser Damer |
発行日 | 2022-06-21 16:42:04+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google