A Few Shot Multi-Representation Approach for N-gram Spotting in Historical Manuscripts

要約

自動テキスト認識の最近の進歩にもかかわらず、歴史的な写本に関しては、パフォーマンスは中程度のままです.
これは主に、大量のデータを必要とする手書きテキスト認識 (HTR) モデルをトレーニングするために使用できるラベル付きデータが不足しているためです。
キーワード スポッティング システム (KWS) は、エラー率が低下するため、HTR の有効な代替手段となりますが、通常はクローズド リファレンス ボキャブラリに限定されます。
この論文では、少量のラベル付けされたトレーニングデータを必要とする少数の文字 (N グラム) のシーケンスを見つけるための少数ショット学習パラダイムを提案します。
重要な n グラムを認識することで、システムの語彙への依存を減らすことができることを示します。
この場合、入力手書き行イメージ内の語彙外 (OOV) 単語は、レキシコンに属する一連の n-gram である可能性があります。
ベンサムの歴史的写本コレクションのサブセットに対して、提案された複数表現アプローチの広範な実験的評価が実行され、この方向でいくつかの本当に有望な結果が得られました。

要約(オリジナル)

Despite recent advances in automatic text recognition, the performance remains moderate when it comes to historical manuscripts. This is mainly because of the scarcity of available labelled data to train the data-hungry Handwritten Text Recognition (HTR) models. The Keyword Spotting System (KWS) provides a valid alternative to HTR due to the reduction in error rate, but it is usually limited to a closed reference vocabulary. In this paper, we propose a few-shot learning paradigm for spotting sequences of a few characters (N-gram) that requires a small amount of labelled training data. We exhibit that recognition of important n-grams could reduce the system’s dependency on vocabulary. In this case, an out-of-vocabulary (OOV) word in an input handwritten line image could be a sequence of n-grams that belong to the lexicon. An extensive experimental evaluation of our proposed multi-representation approach was carried out on a subset of Bentham’s historical manuscript collections to obtain some really promising results in this direction.

arxiv情報

著者 Giuseppe De Gregorio,Sanket Biswas,Mohamed Ali Souibgui,Asma Bensalah,Josep Lladós,Alicia Fornés,Angelo Marcelli
発行日 2022-09-21 15:35:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク