Understanding and Improving CNNs with Complex Structure Tensor: A Biometrics Study

要約

私たちの研究は、CNN が向きの特徴を効果的に抽出するのに苦労しているという証拠を提供します。
確実性のあるコンパクトな方向特徴を含む Complex Structure Tensor を CNN への入力として使用すると、グレースケール入力のみを使用した場合と比較して識別精度が一貫して向上することを示します。
実験では、ミニ複雑な conv-net によって提供された入力が、縮小された CNN サイズと組み合わされて、本格的な一般的な CNN アーキテクチャよりも優れたパフォーマンスを発揮することも実証されました。
これは、哺乳類の視覚に見られる戦略である CNN の方向機能を事前に使用することで、その制限が軽減されるだけでなく、説明可能性とシンクライアントとの関連性も強化されることを示唆しています。
実験は、6 つの最先端の CNN アーキテクチャを使用して、生体認証および検証 (クローズ ワールドおよびオープン ワールド) のための眼周囲画像を含む公的に利用可能なデータ セットに対して行われました。
データとシナリオに応じて、PolyU データセットの SOA 等誤り率 (EER) を 5 ~ 26% 削減しました。

要約(オリジナル)

Our study provides evidence that CNNs struggle to effectively extract orientation features. We show that the use of Complex Structure Tensor, which contains compact orientation features with certainties, as input to CNNs consistently improves identification accuracy compared to using grayscale inputs alone. Experiments also demonstrated that our inputs, which were provided by mini complex conv-nets, combined with reduced CNN sizes, outperformed full-fledged, prevailing CNN architectures. This suggests that the upfront use of orientation features in CNNs, a strategy seen in mammalian vision, not only mitigates their limitations but also enhances their explainability and relevance to thin-clients. Experiments were done on publicly available data sets comprising periocular images for biometric identification and verification (Close and Open World) using 6 State of the Art CNN architectures. We reduced SOA Equal Error Rate (EER) on the PolyU dataset by 5-26% depending on data and scenario.

arxiv情報

著者 Kevin Hernandez-Diaz,Josef Bigun,Fernando Alonso-Fernandez
発行日 2024-04-24 02:51:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク