要約
最近の深層顔認識手法は、著しく劣化した顔画像の超解像において、人間の能力をも凌駕する圧倒的な性能を示しています。しかし、これらのアルゴリズムは、主に非公開の合成データセットで評価されています。そのため、これらのアルゴリズムが公開された顔認識データセットでどのような性能を発揮するかは不明である。一方、既存のデータセットの多くは人種分布を十分に考慮していないため、これらのデータセットで学習させた顔画像認識手法は、特定の人種に偏った学習になってしまいます。本論文では、上記2つの問題に対処するため、Ethnically Diverse Faceの公開データセットEDFace-Celeb-1Mを構築し、顔認識に関するベンチマークタスクを設計する。本データセットには、様々な国を網羅し、バランスの取れた人種構成を持つ170万枚の写真が含まれている。私たちの知る限り、このデータセットは最大かつ一般に公開されている幻覚顔データセットです。本論文では、このデータセットに関連して、様々な評価プロトコルを提供し、既存の最先端手法のベンチマークを行うための包括的な分析も行っています。ベンチマーク評価により、最先端のアルゴリズムの性能と限界が示される。
要約(オリジナル)
Recent deep face hallucination methods show stunning performance in super-resolving severely degraded facial images, even surpassing human ability. However, these algorithms are mainly evaluated on non-public synthetic datasets. It is thus unclear how these algorithms perform on public face hallucination datasets. Meanwhile, most of the existing datasets do not well consider the distribution of races, which makes face hallucination methods trained on these datasets biased toward some specific races. To address the above two problems, in this paper, we build a public Ethnically Diverse Face dataset, EDFace-Celeb-1M, and design a benchmark task for face hallucination. Our dataset includes 1.7 million photos that cover different countries, with balanced race composition. To the best of our knowledge, it is the largest and publicly available face hallucination dataset in the wild. Associated with this dataset, this paper also contributes various evaluation protocols and provides comprehensive analysis to benchmark the existing state-of-the-art methods. The benchmark evaluations demonstrate the performance and limitations of state-of-the-art algorithms.
arxiv情報
著者 | Kaihao Zhang,Dongxu Li,Wenhan Luo,Jingyu Liu,Jiankang Deng,Wei Liu,Stefanos Zafeiriou |
発行日 | 2022-06-08 05:57:11+00:00 |
arxivサイト | arxiv_id(pdf) |