Grains of Saliency: Optimizing Saliency-based Training of Biometric Attack Detection Models

要約

人間の知覚知能をモデルのトレーニングに組み込むと、プレゼンテーション攻撃検出 (PAD) や合成サンプルの検出など、いくつかの困難な生体認証タスクにおけるモデルの汎化能力が向上することが示されています。
最初の収集フェーズの後、人間の視覚的顕著性 (視線追跡データや手書きの注釈など) は、注意メカニズム、強化されたトレーニング サンプル、または損失関数の人間の知覚関連コンポーネントを通じて、モデルのトレーニングに統合できます。
これらの成功にも関わらず、顕著性ベースのトレーニングの重要でありながら無視されているように見える側面は、すべての成果を得る間のバランスを見つけるために必要な顕著性の粒度のレベル (境界ボックス、単一の顕著性マップ、または複数の被験者から集約された顕著性) です。
人間の顕著性の利点とその収集のコスト。
この論文では、いくつかの異なるレベルの顕著性の粒度を調査し、いくつかの異なる CNN にわたってシンプルでありながら効果的な顕著性の後処理技術を使用することによって、PAD と合成顔検出の一般化機能の向上が達成できることを実証します。

要約(オリジナル)

Incorporating human-perceptual intelligence into model training has shown to increase the generalization capability of models in several difficult biometric tasks, such as presentation attack detection (PAD) and detection of synthetic samples. After the initial collection phase, human visual saliency (e.g., eye-tracking data, or handwritten annotations) can be integrated into model training through attention mechanisms, augmented training samples, or through human perception-related components of loss functions. Despite their successes, a vital, but seemingly neglected, aspect of any saliency-based training is the level of salience granularity (e.g., bounding boxes, single saliency maps, or saliency aggregated from multiple subjects) necessary to find a balance between reaping the full benefits of human saliency and the cost of its collection. In this paper, we explore several different levels of salience granularity and demonstrate that increased generalization capabilities of PAD and synthetic face detection can be achieved by using simple yet effective saliency post-processing techniques across several different CNNs.

arxiv情報

著者 Colton R. Crum,Samuel Webster,Adam Czajka
発行日 2024-05-01 17:27:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク