要約
ますますデジタル化された世界では、IDドキュメントの信ity性を検証することは、デジタルバンキング、暗号エクスチャング、レンタルなどの実際のアプリケーションにとって重要な課題となっています。この研究は、フィールドのいくつかの制限をカバーする偽のID検出のトピックに焦点を当てています。
特に、実際のIDドキュメントから公開されているデータは存在しません。ほとんどの研究は、プライバシーの理由により利用できない独自の社内データベースに依存しています。
現場で前進するのが難しいこの重要な課題に光を当てるために、プライバシー(つまり、利用可能な機密データの量)とパフォーマンスのトレードオフを探り、プライバシーを提供する偽のID検出のための新しいパッチごとのアプローチを提案します。
提案されたアプローチでは、i)IDドキュメントの2つのレベルの匿名化(つまり、完全に擬似匿名化された)の2つのレベルの匿名化とii)異なるパッチサイズの構成は、パッチ画像に見える機密データの量を変化させます。
また、視覚変圧器や基礎モデルなどの最先端の方法が分析で考慮されています。
実験フレームワークは、目に見えないデータベース(DLC-2021)で、私たちの提案がパッチおよびIDドキュメントレベルで13.91%と0%EERを達成し、他のデータベースに良好な一般化を示していることを示しています。
この調査に加えて、私たちの研究のもう1つの重要な貢献は、GitHubで利用可能な実験的なフレームワークとモデルとともに、実際のIDドキュメントと偽のIDドキュメントの両方から48,400パッチを含む最初の公開データベースのリリースです。
要約(オリジナル)
In an increasingly digitalized world, verifying the authenticity of ID documents has become a critical challenge for real-life applications such as digital banking, crypto-exchanges, renting, etc. This study focuses on the topic of fake ID detection, covering several limitations in the field. In particular, no publicly available data from real ID documents exists, and most studies rely on proprietary in-house databases that are not available due to privacy reasons. In order to shed some light on this critical challenge that makes difficult to advance in the field, we explore a trade-off between privacy (i.e., amount of sensitive data available) and performance, proposing a novel patch-wise approach for privacy-preserving fake ID detection. Our proposed approach explores how privacy can be enhanced through: i) two levels of anonymization for an ID document (i.e., fully- and pseudo-anonymized), and ii) different patch size configurations, varying the amount of sensitive data visible in the patch image. Also, state-of-the-art methods such as Vision Transformers and Foundation Models are considered in the analysis. The experimental framework shows that, on an unseen database (DLC-2021), our proposal achieves 13.91% and 0% EERs at patch and ID document level, showing a good generalization to other databases. In addition to this exploration, another key contribution of our study is the release of the first publicly available database that contains 48,400 patches from both real and fake ID documents, along with the experimental framework and models, which will be available in our GitHub.
arxiv情報
著者 | Javier Muñoz-Haro,Ruben Tolosana,Ruben Vera-Rodriguez,Aythami Morales,Julian Fierrez |
発行日 | 2025-04-10 14:01:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google