Multichannel Attention Networks with Ensembled Transfer Learning to Recognize Bangla Handwritten Charecter

要約

ベンガル語は、世界で 5 番目に多く話されているネイティブ言語であり、世界で 7 番目に話されている言語であり、ベンガル語の手書き文字認識は何十年にもわたって研究者を魅了してきました。
ただし、英語、アラビア語、トルコ語、漢字認識などの他の言語も、手書き認識システムの開発に大きく貢献してきました。
しかし、文字の類似性、曲率、その他の複雑さのため、ベンガル語の文字認識に関する研究はほとんど行われていません。
しかし、多くの研究者は、ベンガル語の手書き認識を行うために、従来の機械学習および深層学習モデルを使用してきました。
この研究では、アンサンブル転移学習とマルチチャネル アテンション ネットワークを備えた畳み込みニューラル ネットワーク (CNN) が採用されました。
Inception Net と ResNet を含む CNN の 2 つのブランチから特徴を生成し、それらを連結することでアンサンブル特徴の融合を生成しました。
その後、アテンション モジュールを適用して、アンサンブルの特徴からコンテキスト情報を生成しました。
最後に、分類モジュールを適用して特徴と分類を改良しました。
CAMTERdb 3.1.2 データセットを使用して提案されたモデルを評価し、生のデータセットでは 92%、前処理されたデータセットでは 98.00% の精度を達成しました。
私たちは、ベンガル語の手書き文字認識分野への私たちの貢献が大きな発展であると考えています。

要約(オリジナル)

The Bengali language is the 5th most spoken native and 7th most spoken language in the world, and Bengali handwritten character recognition has attracted researchers for decades. However, other languages such as English, Arabic, Turkey, and Chinese character recognition have contributed significantly to developing handwriting recognition systems. Still, little research has been done on Bengali character recognition because of the similarity of the character, curvature and other complexities. However, many researchers have used traditional machine learning and deep learning models to conduct Bengali hand-written recognition. The study employed a convolutional neural network (CNN) with ensemble transfer learning and a multichannel attention network. We generated the feature from the two branches of the CNN, including Inception Net and ResNet and then produced an ensemble feature fusion by concatenating them. After that, we applied the attention module to produce the contextual information from the ensemble features. Finally, we applied a classification module to refine the features and classification. We evaluated the proposed model using the CAMTERdb 3.1.2 data set and achieved 92\% accuracy for the raw dataset and 98.00\% for the preprocessed dataset. We believe that our contribution to the Bengali handwritten character recognition domain will be considered a great development.

arxiv情報

著者 Farhanul Haque,Md. Al-Hasan,Sumaiya Tabssum Mou,Abu Saleh Musa Miah,Jungpil Shin,Md Abdur Rahim
発行日 2024-08-20 15:51:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク