The Learnable Typewriter: A Generative Approach to Text Analysis

要約

タイトル:学習可能タイプライター:テキスト解析の生成的アプローチ

要約:
– 文字解析と認識のための生成的ドキュメント固有アプローチを提供する。
– 無監督のマルチオブジェクトセグメンテーション手法に基づいて構築され、スプライトと呼ばれる制限された視覚要素に基づいて画像を再構築する。
– 同一フォントまたは手書きのテキスト行のセットを入力とした場合、当社のアプローチは多数の異なる文字を学習し、可能であればラインレベルの注釈を活用できる。
– 当社の貢献は2つあり、1つ目は、テキストライン解析のための深い無監督のマルチオブジェクトセグメンテーション手法の適応と評価を提供すること。これらの方法は主に完全無監督の設定で合成データ上で評価されてきたため、実際のテキスト画像に適応し、弱い監督を使用してトレーニングできることを実証することは重要な進歩である。
– 2つ目の貢献は、古文書学と暗号解読の分野での当社の手法の潜在的な可能性を示すことである。
– 当社のアプローチは、3つの非常に異なるデータセット、Google1000データセットの印刷ボリューム、Copiale暗号、および12世紀初頭から13世紀初頭までの歴史的手書き憲章についてデモンストレーションされた。

要約(オリジナル)

We present a generative document-specific approach to character analysis and recognition in text lines. Our main idea is to build on unsupervised multi-object segmentation methods and in particular those that reconstruct images based on a limited amount of visual elements, called sprites. Taking as input a set of text lines with similar font or handwriting, our approach can learn a large number of different characters and leverage line-level annotations when available. Our contribution is twofold. First, we provide the first adaptation and evaluation of a deep unsupervised multi-object segmentation approach for text line analysis. Since these methods have mainly been evaluated on synthetic data in a completely unsupervised setting, demonstrating that they can be adapted and quantitatively evaluated on real images of text and that they can be trained using weak supervision are significant progresses. Second, we show the potential of our method for new applications, more specifically in the field of paleography, which studies the history and variations of handwriting, and for cipher analysis. We demonstrate our approach on three very different datasets: a printed volume of the Google1000 dataset, the Copiale cipher and historical handwritten charters from the 12th and early 13th century.

arxiv情報

著者 Ioannis Siglidis,Nicolas Gonthier,Julien Gaubil,Tom Monnier,Mathieu Aubry
発行日 2023-04-14 14:08:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CV パーマリンク