要約
最近の顔提示攻撃検出 (PAD) は、ドメイン適応 (DA) およびドメイン一般化 (DG) 技術を活用して、未知のドメインでのパフォーマンス低下に対処します。
ただし、DA ベースの PAD 手法ではラベルのないターゲット データへのアクセスが必要ですが、DG ベースの PAD ソリューションのほとんどはアプリオリ、つまり既知のドメイン ラベルに依存しています。
さらに、ほとんどの DA/DG ベースの手法は計算集約的であり、複雑なモデル アーキテクチャや多段階のトレーニング プロセスを必要とします。
この論文では、因果関係の観点から複合 DG タスクとして顔 PAD をモデル化し、それをモデルの最適化に結び付けることを提案します。
反事実的な介入を通じて、上位レベルの表現に隠された因果関係を発掘します。
さらに、ドメイン情報に焦点を当てるのではなく、クラス内の機能レベルのデータ分散を強化するために、クラスガイド付き MixStyle を導入します。
クラスガイド付き MixStyle コンポーネントと反事実介入コンポーネントはどちらも、追加のトレーニング可能なパラメーターや無視できる計算リソースを導入しません。
広範なクロスデータセットと分析実験により、最先端の PAD と比較した私たちの方法の有効性と効率が実証されています。
実装とトレーニングされた重みは公開されています。
要約(オリジナル)
Recent face presentation attack detection (PAD) leverages domain adaptation (DA) and domain generalization (DG) techniques to address performance degradation on unknown domains. However, DA-based PAD methods require access to unlabeled target data, while most DG-based PAD solutions rely on a priori, i.e., known domain labels. Moreover, most DA-/DG-based methods are computationally intensive, demanding complex model architectures and/or multi-stage training processes. This paper proposes to model face PAD as a compound DG task from a causal perspective, linking it to model optimization. We excavate the causal factors hidden in the high-level representation via counterfactual intervention. Moreover, we introduce a class-guided MixStyle to enrich feature-level data distribution within classes instead of focusing on domain information. Both class-guided MixStyle and counterfactual intervention components introduce no extra trainable parameters and negligible computational resources. Extensive cross-dataset and analytic experiments demonstrate the effectiveness and efficiency of our method compared to state-of-the-art PADs. The implementation and the trained weights are publicly available.
arxiv情報
著者 | Meiling Fang,Naser Damer |
発行日 | 2023-08-28 13:11:05+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google