要約
顔認識は、人工知能の分野において、特に近年のディープラーニングの台頭以降、長い間活発な研究分野となっています。実用的な状況においては、各アイデンティティが学習に利用できるサンプルが1つしかない場合があります。このような状況下での顔認識は単一サンプル顔認識と呼ばれ、ディープモデルの効果的な学習に対して大きな課題となっています。そのため、近年、研究者はディープラーニングの潜在能力をさらに引き出し、単一サンプル状況下でのモデル認識性能を向上させることを試みている。従来の単一サンプル顔認識アプローチに関する包括的な調査がいくつか実施されているが、新興の深層学習ベースの手法はこれらのレビューにほとんど関与していない。従って、本論文では、深層学習ベースの手法に焦点を当て、仮想サンプル手法と汎用的な学習手法に分類している。前者では、深層学習モデルの学習に有利なように、仮想画像や仮想特徴を生成する。後者では、追加の複数サンプルの汎用セットを使用する。汎用的学習法には、従来手法と深層特徴の組み合わせ、損失関数の改善、ネットワーク構造の改善の3種類があり、いずれも本分析で取り上げている。さらに、単一標本顔認識モデルの評価によく用いられる顔データセットをレビューし、異なるタイプのモデルの結果を比較することにする。さらに、既存の単一標本顔認識手法の問題点として、仮想標本手法における識別情報の保持、汎用学習手法における領域適応について議論する。さらに、教師なし手法の開発を今後の有望な方向性と位置づけ、セマンティックギャップを今後検討すべき重要な課題として指摘している。
要約(オリジナル)
Face recognition has long been an active research area in the field of artificial intelligence, particularly since the rise of deep learning in recent years. In some practical situations, each identity has only a single sample available for training. Face recognition under this situation is referred to as single sample face recognition and poses significant challenges to the effective training of deep models. Therefore, in recent years, researchers have attempted to unleash more potential of deep learning and improve the model recognition performance in the single sample situation. While several comprehensive surveys have been conducted on traditional single sample face recognition approaches, emerging deep learning based methods are rarely involved in these reviews. Accordingly, we focus on the deep learning-based methods in this paper, classifying them into virtual sample methods and generic learning methods. In the former category, virtual images or virtual features are generated to benefit the training of the deep model. In the latter one, additional multi-sample generic sets are used. There are three types of generic learning methods: combining traditional methods and deep features, improving the loss function, and improving network structure, all of which are covered in our analysis. Moreover, we review face datasets that have been commonly used for evaluating single sample face recognition models and go on to compare the results of different types of models. Additionally, we discuss problems with existing single sample face recognition methods, including identity information preservation in virtual sample methods, domain adaption in generic learning methods. Furthermore, we regard developing unsupervised methods is a promising future direction, and point out that the semantic gap as an important issue that needs to be further considered.
arxiv情報
著者 | Fan Liu,Delong Chen,Fei Wang,Zewen Li,Feng Xu |
発行日 | 2022-08-10 05:52:57+00:00 |
arxivサイト | arxiv_id(pdf) |