要約
シーンテキスト除去(STR)は、シーン画像のテキスト領域を除去する画像変換タスクである。従来のSTR法は、全てのシーンテキストを除去する。つまり、既存の手法では、除去するテキストを選択することができない。本論文では、選択的シーンテキスト除去(SSTR)と名付けた、ユーザが指定したターゲット単語のみを除去する新しいタスク設定を提案する。SSTRはSTRよりも複雑なタスクであるが、提案するマルチモジュール構造はSSTRの効率的な学習を可能にする。実験結果は、提案手法が期待通りにターゲット単語を除去できることを示している。
要約(オリジナル)
Scene text removal (STR) is the image transformation task to remove text regions in scene images. The conventional STR methods remove all scene text. This means that the existing methods cannot select text to be removed. In this paper, we propose a novel task setting named selective scene text removal (SSTR) that removes only target words specified by the user. Although SSTR is a more complex task than STR, the proposed multi-module structure enables efficient training for SSTR. Experimental results show that the proposed method can remove target words as expected.
arxiv情報
著者 | Hayato Mitani,Akisato Kimura,Seiichi Uchida |
発行日 | 2023-09-01 12:07:40+00:00 |
arxivサイト | arxiv_id(pdf) |