Similar Document Template Matching Algorithm

要約

この研究では、テンプレートの抽出、比較、および不正行為の検出における高度な技術を統合して、医療文書を検証するための包括的な方法論の概要を説明します。
まず、輪郭分析とエッジ識別を組み込んだ、高度な関心領域 (ROI) 手法を使用したテンプレート抽出から始まります。
前処理ステップでは、形態学的操作と適応型しきい値処理を通じてテンプレートの明瞭さを確保します。
テンプレート比較アルゴリズムは、キーポイントおよび記述子との高度な特徴マッチングを利用し、会計変動に対するヒストグラムベースの分析を通じて堅牢性を強化します。
不正検出には、SSIM 計算とテキスト情報抽出のための OCR が含まれます。
SSIM は構造的類似性を定量化し、潜在的な一致の識別に役立ちます。
OCR は、患者の詳細、医療提供者情報、請求額などの重要な領域に焦点を当てます。
抽出された情報は参照データセットと比較され、信頼性のしきい値処理により信頼性の高い不正検出が保証されます。
適応パラメータにより、システムの柔軟性が向上し、さまざまなドキュメント レイアウトを動的に調整できます。
この方法論は、医療文書検証に対する堅牢なアプローチを提供し、テンプレートの抽出、比較、不正行為の検出、および多様な文書構造への適応性における複雑さに対処します。

要約(オリジナル)

This study outlines a comprehensive methodology for verifying medical documents, integrating advanced techniques in template extraction, comparison, and fraud detection. It begins with template extraction using sophisticated region-of-interest (ROI) methods, incorporating contour analysis and edge identification. Pre-processing steps ensure template clarity through morphological operations and adaptive thresholding. The template comparison algorithm utilizes advanced feature matching with key points and descriptors, enhancing robustness through histogram-based analysis for accounting variations. Fraud detection involves the SSIM computation and OCR for textual information extraction. The SSIM quantifies structural similarity, aiding in potential match identification. OCR focuses on critical areas like patient details, provider information, and billing amounts. Extracted information is compared with a reference dataset, and confidence thresholding ensures reliable fraud detection. Adaptive parameters enhance system flexibility for dynamic adjustments to varying document layouts. This methodology provides a robust approach to medical document verification, addressing complexities in template extraction, comparison, fraud detection, and adaptability to diverse document structures.

arxiv情報

著者 Harshitha Yenigalla,Bommareddy Revanth Srinivasa Reddy,Batta Venkata Rahul,Nannapuraju Hemanth Raju
発行日 2023-11-21 15:13:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク