Improving 2D face recognition via fine-level facial depth generation and RGB-D complementary feature learning

要約

タイトル:RGB-D補完特徴学習と微細レベル顔深度生成を利用した2D顔認識の向上

要約:
・複雑なシーンでの顔認識は、姿勢変形、不十分な照明、部分的な隠蔽などのノイズが発生するため、正確度が低くなる。
・RGB-Dに対応する深度を取得するために、いくつかの手法が深度推定を利用している。しかし、彼らが生成した深度は画像ぼやけが多く、RGB-D顔認識タスクでノイズを導入する。
・現存するRGB-D顔認識方法は、互いに補完的な特徴を十分に抽出することができない。
・本論文では、微細レベル顔深度生成ネットワークと改良されたマルチモーダル補完特徴学習ネットワークを提案する。
・Lock3DFaceデータセットとIIIT-Dデータセットでの広範な実験結果から、提案されたFFDGNetとIMCFLNetが、最先端の性能を発揮しながらRGB-D顔認識の精度を向上させることができる。

要点:
・複雑なシーンでの顔認識は正確性が低くなる。
・深度推定を利用した手法があるが、生成された深度はノイズが多くRGB-D顔認識タスクでノイズを導入する。
・RGB-D顔認識方法は、互いに補完的な特徴を十分に抽出することができない。
・本論文では、微細レベル顔深度生成ネットワークと改良されたマルチモーダル補完特徴学習ネットワークを提案する。
・提案されたFFDGNetとIMCFLNetは、最先端の性能を発揮しながらRGB-D顔認識の精度を向上させることができる。

要約(オリジナル)

Face recognition in complex scenes suffers severe challenges coming from perturbations such as pose deformation, ill illumination, partial occlusion. Some methods utilize depth estimation to obtain depth corresponding to RGB to improve the accuracy of face recognition. However, the depth generated by them suffer from image blur, which introduces noise in subsequent RGB-D face recognition tasks. In addition, existing RGB-D face recognition methods are unable to fully extract complementary features. In this paper, we propose a fine-grained facial depth generation network and an improved multimodal complementary feature learning network. Extensive experiments on the Lock3DFace dataset and the IIIT-D dataset show that the proposed FFDGNet and I MCFLNet can improve the accuracy of RGB-D face recognition while achieving the state-of-the-art performance.

arxiv情報

著者 Wenhao Hu
発行日 2023-05-08 02:33:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク