Geometric Rectification of Creased Document Images based on Isometric Mapping

要約

歪んだ文書の画像の幾何学的修正は、文書のデジタル化と光学式文字認識 (OCR) に幅広い用途があります。
滑らかに湾曲した変形は多くの研究で広く研究されてきましたが、最も困難な変形、例えば
複雑な折り目や大きな折り目は、特に研究されていません。
既存のアプローチの性能は、大幅に折り目がついた、または折り畳まれた文書に適用された場合、満足とはほど遠いものであり、改善の余地がかなり残されています。
このタスクに取り組むには、ドキュメントの修正に関する知識を計算に組み込む必要があります。その中で、3D ドキュメント モデルの展開可能性と、直線などの画像の特定のテクスチャ機能が最も重要です。
この目的のために、3Dドキュメントモデルとその平面内での平坦化を表現するために計算アイソメトリックマッピングモデルが利用されるドキュメント画像修正の一般的なフレームワークを提案します。
このフレームワークに基づいて、モデルの開発可能性とテクスチャの特徴の両方が計算で考慮されます。
実験と最先端のアプローチとの比較により、提案された方法の有効性と優れた性能が実証されました。
私たちの方法は、画像内の高品質の特徴線を抽出する他の方法によって修正結果を強化できるという点でも柔軟です。

要約(オリジナル)

Geometric rectification of images of distorted documents finds wide applications in document digitization and Optical Character Recognition (OCR). Although smoothly curved deformations have been widely investigated by many works, the most challenging distortions, e.g. complex creases and large foldings, have not been studied in particular. The performance of existing approaches, when applied to largely creased or folded documents, is far from satisfying, leaving substantial room for improvement. To tackle this task, knowledge about document rectification should be incorporated into the computation, among which the developability of 3D document models and particular textural features in the images, such as straight lines, are the most essential ones. For this purpose, we propose a general framework of document image rectification in which a computational isometric mapping model is utilized for expressing a 3D document model and its flattening in the plane. Based on this framework, both model developability and textural features are considered in the computation. The experiments and comparisons to the state-of-the-art approaches demonstrated the effectiveness and outstanding performance of the proposed method. Our method is also flexible in that the rectification results can be enhanced by any other methods that extract high-quality feature lines in the images.

arxiv情報

著者 Dong Luo,Pengbo Bo
発行日 2022-12-16 09:33:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.GR, I.5.4 パーマリンク