LDRNet: Enabling Real-time Document Localization on Mobile Devices

要約

モバイルデバイス上の本人確認書類検証 (IDV) テクノロジーが現代のビジネス運営において広く普及する一方で、個人情報の盗難や詐欺のリスクは増大しています。
身分証明書保持者は通常、なりすまし者を回避するためにオンラインビデオ面接に参加する必要があります。
ただし、現在の IDV プロセスは、オンラインでの段階的なガイダンスをサポートするための追加の人員に依存しており、非効率的で費用がかかります。
既存の AI ベースのアプローチのパフォーマンスは、モバイル デバイスのリアルタイム性と軽量性の要求を満たすことができません。
このペーパーでは、リアルタイム IDV 向けのエッジ インテリジェンス支援アプローチを設計することで、これらの課題に対処します。
IDV プロセスの応答性を向上させることを目的として、アイデンティティ ドキュメントをリアルタイムでローカライズするモバイル デバイス用の新しいドキュメント ローカリゼーション モデル、LDRNet を提案します。
軽量のバックボーン ネットワークに基づいて、LDRNet の 3 つの予測ブランチ、コーナー ポイント予測、ライン境界予測、およびドキュメント分類を構築します。
新しい補助ターゲットである等分割ポイントを設計し、Line Loss という新しい損失関数を使用して、アプローチの速度と精度を向上させます。
IDV プロセスに加えて、LDRNet は、あらゆる種類のモバイル アプリケーションに対する効率的で信頼性の高いドキュメント ローカリゼーションの代替手段です。
その証拠として、LDRNet のパフォーマンスを、一般的なドキュメント データセットのローカライズに関する他の一般的なアプローチと比較します。
実験結果は、LDRNet が 47 倍高速である最大 790 FPS の速度で動作すると同時に、単一モデルおよび単一スケールのテストで同等の Jaccard Index(JI) を達成することを示しています。

要約(オリジナル)

While Identity Document Verification (IDV) technology on mobile devices becomes ubiquitous in modern business operations, the risk of identity theft and fraud is increasing. The identity document holder is normally required to participate in an online video interview to circumvent impostors. However, the current IDV process depends on an additional human workforce to support online step-by-step guidance which is inefficient and expensive. The performance of existing AI-based approaches cannot meet the real-time and lightweight demands of mobile devices. In this paper, we address those challenges by designing an edge intelligence-assisted approach for real-time IDV. Aiming at improving the responsiveness of the IDV process, we propose a new document localization model for mobile devices, LDRNet, to Localize the identity Document in Real-time. On the basis of a lightweight backbone network, we build three prediction branches for LDRNet, the corner points prediction, the line borders prediction and the document classification. We design novel supplementary targets, the equal-division points, and use a new loss function named Line Loss, to improve the speed and accuracy of our approach. In addition to the IDV process, LDRNet is an efficient and reliable document localization alternative for all kinds of mobile applications. As a matter of proof, we compare the performance of LDRNet with other popular approaches on localizing general document datasets. The experimental results show that LDRNet runs at a speed up to 790 FPS which is 47x faster, while still achieving comparable Jaccard Index(JI) in single-model and single-scale tests.

arxiv情報

著者 Han Wu,Holland Qian,Huaming Wu,Aad van Moorsel
発行日 2023-10-12 13:55:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.PF パーマリンク