Handwritten Text Recognition Using Convolutional Neural Network

要約

OCR (光学文字認識) は、文書をスキャンするだけで、電子的な速度で手書き文字と印刷文字の包括的な英数字認識を提供するテクノロジーです。
最近、視覚データの理解は、インテリジェント文字認識 (ICR) と呼ばれています。
Intelligent Character Recognition (ICR) は、手書きまたは印刷された文字のスキャンを ASCII テキストに変換できる OCR モジュールです。
ASCII データは、電子通信におけるデータ エンコードの標準形式です。
ASCII は、文字、数字、記号、空白、その他の文字に標準の数値を割り当てます。
より専門的に言えば、OCR は、電子デバイスを使用して 2 次元のテキスト情報を機械エンコードされたテキストに変換するプロセスです。
機械で書かれたテキストまたは手書きのテキストを含むものはすべて、スキャナーでスキャンするか、単にテキストの画像だけで認識システムがテキストを区別するのに十分です。
この論文の目的は、100,000 枚以上の画像を含む国立科学技術研究所 (NIST) データセットでトレーニングされた畳み込みニューラル ネットワーク モデルの結果を示すことです。
ネットワークは画像から抽出された特徴から学習し、それを使用して画像が属する各クラスの確率を生成します。
2.53% の損失で 90.54% の精度を達成しました。

要約(オリジナル)

OCR (Optical Character Recognition) is a technology that offers comprehensive alphanumeric recognition of handwritten and printed characters at electronic speed by merely scanning the document. Recently, the understanding of visual data has been termed Intelligent Character Recognition (ICR). Intelligent Character Recognition (ICR) is the OCR module that can convert scans of handwritten or printed characters into ASCII text. ASCII data is the standard format for data encoding in electronic communication. ASCII assigns standard numeric values to letters, numeral, symbols, white-spaces and other characters. In more technical terms, OCR is the process of using an electronic device to transform 2-Dimensional textual information into machine-encoded text. Anything that contains text both machine written or handwritten can be scanned either through a scanner or just simply a picture of the text is enough for the recognition system to distinguish the text. The goal of this papers is to show the results of a Convolutional Neural Network model which has been trained on National Institute of Science and Technology (NIST) dataset containing over a 100,000 images. The network learns from the features extracted from the images and use it to generate the probability of each class to which the picture belongs to. We have achieved an accuracy of 90.54% with a loss of 2.53%.

arxiv情報

著者 Atman Mishra,A. Sharath Ram,Kavyashree C
発行日 2023-07-11 15:57:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク