要約
ID ドキュメント内の正確なバーコード検出とデコードは、信頼性の高いデータ抽出と検証が不可欠なセキュリティ、医療、教育などのアプリケーションにとって非常に重要です。
ただし、多様で現実的なデータセットが不足しているため、堅牢な検出モデルを構築することは困難です。このデータセットは、多くの場合、プライバシーの問題や文書形式の多様性に関連する問題です。
Faker などの従来のツールは、事前定義されたテンプレートに依存しているため、現実世界の ID ドキュメントの複雑さを把握する効果が低くなります。
このペーパーでは、事前定義されたフィールドに依存せずに、LLM を使用してコンテキストに富んだ現実的なデータを作成する、合成データ生成への新しいアプローチを紹介します。
LLM がさまざまな文書やコンテンツに関して持つ膨大な知識を使用して、私たちの方法は、実際のアイデンティティ文書に見られる多様性を反映するデータを作成します。
このデータはバーコードにエンコードされ、運転免許証、保険カード、学生証などの文書のテンプレートにオーバーレイされます。
私たちのアプローチはデータセット作成のプロセスを簡素化し、広範なドメイン知識や事前定義されたフィールドの必要性を排除します。
Faker などの従来の方法と比較して、LLM によって生成されたデータはより多様性と文脈上の関連性を示し、バーコード検出モデルのパフォーマンスの向上につながります。
このスケーラブルなプライバシー最優先ソリューションは、自動化された文書処理と本人確認のための機械学習の進歩において大きな前進となります。
要約(オリジナル)
Accurate barcode detection and decoding in Identity documents is crucial for applications like security, healthcare, and education, where reliable data extraction and verification are essential. However, building robust detection models is challenging due to the lack of diverse, realistic datasets an issue often tied to privacy concerns and the wide variety of document formats. Traditional tools like Faker rely on predefined templates, making them less effective for capturing the complexity of real-world identity documents. In this paper, we introduce a new approach to synthetic data generation that uses LLMs to create contextually rich and realistic data without relying on predefined field. Using the vast knowledge LLMs have about different documents and content, our method creates data that reflects the variety found in real identity documents. This data is then encoded into barcode and overlayed on templates for documents such as Driver’s licenses, Insurance cards, Student IDs. Our approach simplifies the process of dataset creation, eliminating the need for extensive domain knowledge or predefined fields. Compared to traditional methods like Faker, data generated by LLM demonstrates greater diversity and contextual relevance, leading to improved performance in barcode detection models. This scalable, privacy-first solution is a big step forward in advancing machine learning for automated document processing and identity verification.
arxiv情報
著者 | Hitesh Laxmichand Patel,Amit Agarwal,Bhargava Kumar,Karan Gupta,Priyaranjan Pattnayak |
発行日 | 2024-11-22 14:21:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google