顔認証システムを様々な物理的攻撃から守るためには、Face Anti-spoofing(FAS)が不可欠である。しかし、最近の研究は一般的に近距離のアプリケーション(例:電話のロック解除)に焦点を当て、遠距離のシーン(例:監視カメラのセキュリティチェック)に対する考察が欠けています。関連研究を促進し、コミュニティのこのギャップを埋めるために、我々は、異なる年齢層の101人の被験者が232の3D攻撃(高忠実度マスク)、200の2D攻撃(ポスター、ポートレート、スクリーン)、および2敵対攻撃と40監視シーン下でキャプチャした大規模Surveillance High-Fidelity Mask (SuHiFiMask) データセットを収集する。このシーンでは、低解像度とノイズの干渉が監視用FASの新たな課題として挙げられています。SuHiFiMaskデータセットとともに、画質に起因する性能劣化を3つの側面から緩和するCQIL(Contrastive Quality-Invariance Learning)ネットワークを提案する。 (1) 画質変数モジュール(IQV)を導入し、超解像ネットワークと組み合わせて識別に関わる画像情報を回復させる。(2) 生成されたサンプルペアを用いて品質分散分布をシミュレートし、コントラスト学習戦略が品質変動下で頑健な特徴表現を獲得することを支援する。(3) 画質に依存しない識別特徴を学習するために、Separate Quality Network (SQN)を設計する。最後に、多数の実験により、SuHiFiMaskデータセットの品質と、提案するCQILの優位性を検証する。
Face Anti-spoofing (FAS) is essential to secure face recognition systems from various physical attacks. However, recent research generally focuses on short-distance applications (i.e., phone unlocking) while lacking consideration of long-distance scenes (i.e., surveillance security checks). In order to promote relevant research and fill this gap in the community, we collect a large-scale Surveillance High-Fidelity Mask (SuHiFiMask) dataset captured under 40 surveillance scenes, which has 101 subjects from different age groups with 232 3D attacks (high-fidelity masks), 200 2D attacks (posters, portraits, and screens), and 2 adversarial attacks. In this scene, low image resolution and noise interference are new challenges faced in surveillance FAS. Together with the SuHiFiMask dataset, we propose a Contrastive Quality-Invariance Learning (CQIL) network to alleviate the performance degradation caused by image quality from three aspects: (1) An Image Quality Variable module (IQV) is introduced to recover image information associated with discrimination by combining the super-resolution network. (2) Using generated sample pairs to simulate quality variance distributions to help contrastive learning strategies obtain robust feature representation under quality variation. (3) A Separate Quality Network (SQN) is designed to learn discriminative features independent of image quality. Finally, a large number of experiments verify the quality of the SuHiFiMask dataset and the superiority of the proposed CQIL.
著者 | Hao Fang,Ajian Liu,Jun Wan,Sergio Escalera,Chenxu Zhao,Xu Zhang,Stan Z. Li,Zhen Lei |
発行日 | 2023-01-03 07:09:57+00:00 |
arxivサイト | arxiv_id(pdf) |