Text Region Multiple Information Perception Network for Scene Text Detection

要約

セグメンテーションベースのシーンテキスト検出アルゴリズムは、任意の形状のシーンテキストを処理でき、強い堅牢性と適応性を備えているため、広く注目を集めています。
既存のセグメンテーションベースのシーンテキスト検出アルゴリズムは通常、テキストの中央領域のピクセルのみをセグメント化し、エッジ情報や距離情報などのテキスト領域の他の情報を無視するため、アルゴリズムの検出精度が制限されます。
シーンテキスト。
この論文では、セグメンテーション ベースのアルゴリズムの検出パフォーマンスを強化するために、領域多重情報認識モジュール (RMIPM) と呼ばれるプラグ アンド プレイ モジュールを提案します。
具体的には、テキスト前景分類マップ、距離マップ、方向マップなど、シーンのテキスト領域に関するさまざまなタイプの情報を認識できる改良されたモジュールを設計します。MSRA-TD500 および TotalText データセットでの実験では、私たちの方法が以下と同等のパフォーマンスを達成することが示されています。
現在の最先端のアルゴリズム。

要約(オリジナル)

Segmentation-based scene text detection algorithms can handle arbitrary shape scene texts and have strong robustness and adaptability, so it has attracted wide attention. Existing segmentation-based scene text detection algorithms usually only segment the pixels in the center region of the text, while ignoring other information of the text region, such as edge information, distance information, etc., thus limiting the detection accuracy of the algorithm for scene text. This paper proposes a plug-and-play module called the Region Multiple Information Perception Module (RMIPM) to enhance the detection performance of segmentation-based algorithms. Specifically, we design an improved module that can perceive various types of information about scene text regions, such as text foreground classification maps, distance maps, direction maps, etc. Experiments on MSRA-TD500 and TotalText datasets show that our method achieves comparable performance with current state-of-the-art algorithms.

arxiv情報

著者 Jinzhi Zheng,Libo Zhang,Yanjun Wu,Chen Zhao
発行日 2024-01-18 14:36:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク