Enhancing OCR Performance through Post-OCR Models: Adopting Glyph Embedding for Improved Correction

要約

この研究では、OCR モデルの限界を克服する OCR 後モデルの可能性を調査し、グリフ埋め込みを組み込むことが OCR 後の修正パフォーマンスに及ぼす影響を調査します。
この研究では、独自の OCR 後補正モデルを開発しました。
私たちのアプローチの斬新さは、CharBERT と独自の埋め込み技術を使用して OCR 出力を埋め込み、文字の視覚的特徴をキャプチャすることにあります。
私たちの調査結果は、OCR 後の修正が劣悪な OCR モデルの欠陥に効果的に対処し、グリフ埋め込みによりモデルが個々の単語を修正する機能などの優れた結果を達成できることを示しています。

要約(オリジナル)

The study investigates the potential of post-OCR models to overcome limitations in OCR models and explores the impact of incorporating glyph embedding on post-OCR correction performance. In this study, we have developed our own post-OCR correction model. The novelty of our approach lies in embedding the OCR output using CharBERT and our unique embedding technique, capturing the visual characteristics of characters. Our findings show that post-OCR correction effectively addresses deficiencies in inferior OCR models, and glyph embedding enables the model to achieve superior results, including the ability to correct individual words.

arxiv情報

著者 Yung-Hsin Chen,Yuli Zhou
発行日 2023-08-29 12:41:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.CV パーマリンク