Bengali Handwritten Digit Recognition using CNN with Explainable AI

要約

手書き文字認識は、現在研究のホットなトピックです。
手書きの紙を光学式文字認識 (OCR) 技術を使用してテキスト検索可能なドキュメントに変換できれば、その内容を簡単に理解でき、手書きのドキュメントを読む必要がなくなります。
英語の OCR は非常に一般的ですが、ベンガル語では、高品質の OCR アプリケーションを見つけるのは非常に困難です。
機械学習と深層学習を OCR と融合できれば、この分野に大きく貢献する可能性があります。
さまざまな研究者が、ベンガル語の手書き文字を認識するための多くの戦略を提案しています。
多くの ML アルゴリズムとディープ ニューラル ネットワークが彼らの仕事で使用されましたが、それらのモデルの説明は利用できません。
私たちの仕事では、さまざまな機械学習アルゴリズムと CNN を使用して、手書きのベンガル数字を認識しました。
一部の ML モデルからは許容できる精度が得られ、CNN は優れたテスト精度を提供してくれました。
Grad-CAM は、CNN モデルの XAI メソッドとして使用されました。これにより、モデルへの洞察が得られ、画像から数字を認識するための関心の起源を検出するのに役立ちました。

要約(オリジナル)

Handwritten character recognition is a hot topic for research nowadays. If we can convert a handwritten piece of paper into a text-searchable document using the Optical Character Recognition (OCR) technique, we can easily understand the content and do not need to read the handwritten document. OCR in the English language is very common, but in the Bengali language, it is very hard to find a good quality OCR application. If we can merge machine learning and deep learning with OCR, it could be a huge contribution to this field. Various researchers have proposed a number of strategies for recognizing Bengali handwritten characters. A lot of ML algorithms and deep neural networks were used in their work, but the explanations of their models are not available. In our work, we have used various machine learning algorithms and CNN to recognize handwritten Bengali digits. We have got acceptable accuracy from some ML models, and CNN has given us great testing accuracy. Grad-CAM was used as an XAI method on our CNN model, which gave us insights into the model and helped us detect the origin of interest for recognizing a digit from an image.

arxiv情報

著者 Md Tanvir Rouf Shawon,Raihan Tanvir,Md. Golam Rabiul Alam
発行日 2022-12-23 04:40:20+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG パーマリンク