要約
パンデミック後の時代において、マスクの着用は通常の顔認識に大きな課題をもたらしています。
以前の研究では、研究者らは事前トレーニングされた VGG16 と ResNet50 を適用して、精巧に精選された既存のマスク顔認識 (MFR) データセット、RMFRD および SMFRD の特徴を抽出しました。
サンプル サイズが小さく、カメラ環境の変化が大きい現実世界の状況によりモデルを適応させるために、Labeled Faces in the Wild (LFW) から 1702 枚の画像を含む 50 のアイデンティティを選択することで、より困難なマスクされた顔データセットを独自に作成しました。
) データセット、およびキーポイント検出によるシミュレートされたフェイスマスク。
私たちの研究のもう 1 つの部分は、マスクされた顔認識問題を解決することであり、事前トレーニングされたモデルを直接使用する代わりに、以前の最先端の結果を参照してモデルを選択し、新しいデータセットでモデルを微調整し、最新のデータセットを使用しました。
線形レイヤーを使用して直接分類を行います。
さらに、テスト精度をさらに高めるためにデータ拡張戦略を使用することを提案し、以前の研究を超えて、最も SOTA ネットワークの 1 つである新しいネットワークである Inception ResNet v1 を微調整しました。
50 ID MFR での最高のテスト精度は 95% を達成しました。
要約(オリジナル)
In the post-pandemic era, wearing face masks has posed great challenge to the ordinary face recognition. In the previous study, researchers has applied pretrained VGG16, and ResNet50 to extract features on the elaborate curated existing masked face recognition (MFR) datasets, RMFRD and SMFRD. To make the model more adaptable to the real world situation where the sample size is smaller and the camera environment has greater changes, we created a more challenging masked face dataset ourselves, by selecting 50 identities with 1702 images from Labelled Faces in the Wild (LFW) Dataset, and simulated face masks through key point detection. The another part of our study is to solve the masked face recognition problem, and we chose models by referring to the former state of the art results, instead of directly using pretrained models, we fine tuned the model on our new dataset and use the last linear layer to do the classification directly. Furthermore, we proposed using data augmentation strategy to further increase the test accuracy, and fine tuned a new networks beyond the former study, one of the most SOTA networks, Inception ResNet v1. The best test accuracy on 50 identity MFR has achieved 95%.
arxiv情報
著者 | Rui Cai,Xuying Ning,Peter N. Belhumeur |
発行日 | 2023-11-13 17:09:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google