Offline Text-Independent Writer Identification based on word level data

要約

本論文では、個人の手書き入力単語画像に基づき、文書の作成者を特定する新しい方式を提案する。本手法はテキストに依存せず、また入力される単語画像のサイズに制約を受けない。まず、SIFTアルゴリズムを用いて、様々な抽象度で複数のキーポイントを抽出する(同形文字、文字、文字の組み合わせからなる)。これらのキーポイントは、学習されたCNNネットワークに渡され、畳み込み層に対応する特徴マップが生成される。しかし、SIFTキーポイントに対応する縮尺により、生成される特徴マップの大きさが異なる場合がある。この問題を解決するために、特徴マップに勾配のヒストグラムを適用し、一定の表現にする。一般にCNNでは,ネットワークの深さに応じて,各畳み込みブロックのフィルタ数が増加する.そのため、それぞれの畳み込み特徴マップに対してヒストグラム特徴を抽出すると、次元数だけでなく計算負荷も増加する。そこで、本提案では、学習段階において、エントロピーに基づく手法により、特定のCNN層の特徴マップの重みを学習する。提案システムの有効性をCVLとIAMという一般に公開されている2つのデータベースで実証した。得られた結果は、従来の研究と比較して有望であることを経験的に示している。

要約(オリジナル)

This paper proposes a novel scheme to identify the authorship of a document based on handwritten input word images of an individual. Our approach is text-independent and does not place any restrictions on the size of the input word images under consideration. To begin with, we employ the SIFT algorithm to extract multiple key points at various levels of abstraction (comprising allograph, character, or combination of characters). These key points are then passed through a trained CNN network to generate feature maps corresponding to a convolution layer. However, owing to the scale corresponding to the SIFT key points, the size of a generated feature map may differ. As an alleviation to this issue, the histogram of gradients is applied on the feature map to produce a fixed representation. Typically, in a CNN, the number of filters of each convolution block increase depending on the depth of the network. Thus, extracting histogram features for each of the convolution feature map increase the dimension as well as the computational load. To address this aspect, we use an entropy-based method to learn the weights of the feature maps of a particular CNN layer during the training phase of our algorithm. The efficacy of our proposed system has been demonstrated on two publicly available databases namely CVL and IAM. We empirically show that the results obtained are promising when compared with previous works.

arxiv情報

著者 Vineet Kumar,Suresh Sundaram
発行日 2022-07-05 11:03:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク