T360RRD: A dataset for 360 degree rotated rectangular box table detection

要約

回転画像テーブル検出データセットの希少性と高いアノテーションコストの問題に対処するため、本論文は回転画像テーブル検出データセットを構築する方法を提案する。ICDAR2019MTD現代テーブル検出データセットをベースに、DOTAデータセットのアノテーションフォーマットを参照し、TRR360D回転テーブル検出データセットを構築する。トレーニングセットには600枚の回転画像と977個のアノテーションインスタンスが含まれ、テストセットには240枚の回転画像と499個のアノテーションインスタンスが含まれる。AP50(T<90)という評価指標が定義されており、このデータセットは今後の研究者が回転テーブル検出アルゴリズムを研究し、テーブル検出技術の開発を促進するために利用可能である。TRR360D回転テーブル検出データセットは、始点と注釈方向を制約して作成され、https://github.com/vansin/TRR360D、一般に公開されています。

要約(オリジナル)

To address the problem of scarcity and high annotation costs of rotated image table detection datasets, this paper proposes a method for building a rotated image table detection dataset. Based on the ICDAR2019MTD modern table detection dataset, we refer to the annotation format of the DOTA dataset to create the TRR360D rotated table detection dataset. The training set contains 600 rotated images and 977 annotated instances, and the test set contains 240 rotated images and 499 annotated instances. The AP50(T<90) evaluation metric is defined, and this dataset is available for future researchers to study rotated table detection algorithms and promote the development of table detection technology. The TRR360D rotated table detection dataset was created by constraining the starting point and annotation direction, and is publicly available at https://github.com/vansin/TRR360D.

arxiv情報

著者 Wenxing Hu,Minglei Tong
発行日 2023-03-06 01:49:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク