IFAST: Weakly Supervised Interpretable Face Anti-spoofing from Single-shot Binocular NIR Images

要約

シングルショット顔アンチスプーフィング (FAS) は、顔認識システムを保護するための重要な技術であり、入力として必要なのは静止画像のみです。
ただし、シングルショット FAS は、次の 2 つの主な理由により、依然として課題があり、十分に調査されていない問題です。1) データ側では、RGB 画像からの FAS の学習は主にコンテキストに依存しており、追加のアノテーションのないシングルショット画像には限られた意味情報が含まれています。

2) モデル側では、既存のシングルショット FAS モデルはその決定に対する適切な証拠を提供することが不可能であり、深度推定に基づく FAS 手法は高価なピクセルごとのアノテーションを必要とします。
これらの問題に対処するために、大規模な両眼 NIR 画像データセット (BNI-FAS) が構築および公開されており、これには 300,000 を超える実際の顔および飛行機攻撃画像が含まれています。また、生成に弱い監視のみを必要とする Interpretable FAS Transformer (IFAST) が提案されています。
解釈可能な予測。
私たちの IFAST は、Dynamic Matching Attendant (DMA) ブロックを備えた提案された視差推定トランスフォーマーによってピクセル単位の視差マップを生成できます。
さらに、提案されたデュアル教師蒸留モジュールと連携して、最終的な判別結果を取得するために、適切に設計された信頼度マップ ジェネレーターが採用されています。
包括的な実験により、当社の IFAST が BNI-FAS で最先端の結果を達成できることが示され、両眼 NIR 画像に基づくシングルショット FAS の有効性が証明されました。

要約(オリジナル)

Single-shot face anti-spoofing (FAS) is a key technique for securing face recognition systems, and it requires only static images as input. However, single-shot FAS remains a challenging and under-explored problem due to two main reasons: 1) on the data side, learning FAS from RGB images is largely context-dependent, and single-shot images without additional annotations contain limited semantic information. 2) on the model side, existing single-shot FAS models are infeasible to provide proper evidence for their decisions, and FAS methods based on depth estimation require expensive per-pixel annotations. To address these issues, a large binocular NIR image dataset (BNI-FAS) is constructed and published, which contains more than 300,000 real face and plane attack images, and an Interpretable FAS Transformer (IFAST) is proposed that requires only weak supervision to produce interpretable predictions. Our IFAST can produce pixel-wise disparity maps by the proposed disparity estimation Transformer with Dynamic Matching Attention (DMA) block. Besides, a well-designed confidence map generator is adopted to cooperate with the proposed dual-teacher distillation module to obtain the final discriminant results. The comprehensive experiments show that our IFAST can achieve state-of-the-art results on BNI-FAS, proving the effectiveness of the single-shot FAS based on binocular NIR images.

arxiv情報

著者 Jiancheng Huang,Donghao Zhou,Shifeng Chen
発行日 2023-09-29 17:00:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク