Innovative Methods for Non-Destructive Inspection of Handwritten Documents

要約

手書き文書の分析は法医学の分野であり、固有の特徴の検査を通じて文書の作成者を証明することを目的としています。
法執行機関は、手書き文書の手動処理に基づいた標準プロトコルを使用しています。
この方法は時間がかかり、評価が主観的になることが多く、再現性がありません。
これらの制限を克服するために、本論文では、画像処理と深層学習技術を使用して、テキスト行の高さ、単語間のスペース、および文字サイズに関連する原稿文書の固有の尺度を抽出および分析できるフレームワークを紹介します。
関連する各ドキュメントの最終的な特徴ベクトルは、収集されたあらゆる種類の測定値の平均と標準偏差で構成されます。
比較対象の文書の特徴ベクトル間のユークリッド距離を定量化することで、著者を識別できます。
また、124 人の異なる人々が紙やデジタル デバイスに書いた 362 枚の手書き原稿で構成される、新しくて挑戦的なデータセットも提案しました。
私たちの研究は、従来の手書き文書とデジタルツール (タブレットなど) で作成された文書との比較を先駆的に行いました。
実験結果は、さまざまな筆記媒体の著者を客観的に判断するための私たちの方法の能力が、最先端技術を上回っていることを示しています。

要約(オリジナル)

Handwritten document analysis is an area of forensic science, with the goal of establishing authorship of documents through examination of inherent characteristics. Law enforcement agencies use standard protocols based on manual processing of handwritten documents. This method is time-consuming, is often subjective in its evaluation, and is not replicable. To overcome these limitations, in this paper we present a framework capable of extracting and analyzing intrinsic measures of manuscript documents related to text line heights, space between words, and character sizes using image processing and deep learning techniques. The final feature vector for each document involved consists of the mean and standard deviation for every type of measure collected. By quantifying the Euclidean distance between the feature vectors of the documents to be compared, authorship can be discerned. We also proposed a new and challenging dataset consisting of 362 handwritten manuscripts written on paper and digital devices by 124 different people. Our study pioneered the comparison between traditionally handwritten documents and those produced with digital tools (e.g., tablets). Experimental results demonstrate the ability of our method to objectively determine authorship in different writing media, outperforming the state of the art.

arxiv情報

著者 Eleonora Breci,Luca Guarnera,Sebastiano Battiato
発行日 2023-10-17 12:45:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク