Beyond Spatial Explanations: Explainable Face Recognition in the Frequency Domain

要約

最近、他の視覚ベースの意思決定システムと同様に、より透明性の高い顔認識 (FR) の必要性が、研究、社会、産業界でより注目を集めています。
深層学習ベースの顔認識システムによって 2 つの顔画像が一致する、または一致しない理由は、パラメーターの数が多く、モデルが複雑であるため、明らかではありません。
ただし、ユーザー、オペレーター、開発者にとって、システムの信頼性と説明責任を確保し、偏った動作などの欠点を分析することが重要です。
これまでの多くの研究では、空間意味マップを使用して顔認識システムの決定に重大な影響を与える領域を強調表示していましたが、CNN によっても考慮される周波数成分は無視されています。
この研究では、私たちは一歩前進して、未踏の周波数領域で説明可能な顔認識を調査します。
これにより、この研究は、周波数領域における検証に基づく決定の説明可能性を初めて提案し、得られる結果に対する各入力の周波数成分の相対的な影響を説明します。
これを達成するために、空間周波数領域で顔画像を操作し、検証結果への影響を調査します。
広範な定量的実験では、クロス解像度 FR とモーフィング攻撃 (後者は補足資料にある) という 2 つの特別なシナリオのケースを調査するとともに、提案した周波数ベースの説明の適用可能性を観察します。

要約(オリジナル)

The need for more transparent face recognition (FR), along with other visual-based decision-making systems has recently attracted more attention in research, society, and industry. The reasons why two face images are matched or not matched by a deep learning-based face recognition system are not obvious due to the high number of parameters and the complexity of the models. However, it is important for users, operators, and developers to ensure trust and accountability of the system and to analyze drawbacks such as biased behavior. While many previous works use spatial semantic maps to highlight the regions that have a significant influence on the decision of the face recognition system, frequency components which are also considered by CNNs, are neglected. In this work, we take a step forward and investigate explainable face recognition in the unexplored frequency domain. This makes this work the first to propose explainability of verification-based decisions in the frequency domain, thus explaining the relative influence of the frequency components of each input toward the obtained outcome. To achieve this, we manipulate face images in the spatial frequency domain and investigate the impact on verification outcomes. In extensive quantitative experiments, along with investigating two special scenarios cases, cross-resolution FR and morphing attacks (the latter in supplementary material), we observe the applicability of our proposed frequency-based explanations.

arxiv情報

著者 Marco Huber,Naser Damer
発行日 2024-07-16 17:29:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク