T360RRD: A dataset for 360 degree rotated rectangular box table detection

要約

回転画像テーブル検出データセットの希少性と高いアノテーションコストの問題を解決するために、本章では回転画像テーブル検出データセットの構築方法を提案する。表4.1に示すように、ICDAR2019MTD現代テーブル検出データセットをベースに、DOTAデータセットのアノテーションフォーマットを参照し、TRR360D回転テーブル検出データセットを構築する。トレーニングセットには、600枚の回転画像と977個の注釈付きインスタンスが含まれ、テストセットには240枚の回転画像と499個の注釈付きインスタンスが含まれる。DOTA_360評価指標を定義し、このデータセットは、今後の研究者が回転テーブル検出アルゴリズムを研究し、テーブル検出技術の開発を促進するために利用可能である。TRR360D回転テーブル検出データセットは、始点とアノテーション方向を制約して作成され、⽋⽋に公開されています。

要約(オリジナル)

To address the problem of scarcity and high annotation costs of rotated image table detection datasets, this chapter proposes a method for building a rotated image table detection dataset. Based on the ICDAR2019MTD modern table detection dataset, we refer to the annotation format of the DOTA dataset to create the TRR360D rotated table detection dataset, as shown in Table 4.1. The training set contains 600 rotated images and 977 annotated instances, and the test set contains 240 rotated images and 499 annotated instances. The DOTA\_360 evaluation metric is defined, and this dataset is available for future researchers to study rotated table detection algorithms and promote the development of table detection technology. The TRR360D rotated table detection dataset was created by constraining the starting point and annotation direction, and is publicly available at \url{https://github.com/vansin/TRR360D}.

arxiv情報

著者 Wenxing Hu,Minglei Tong
発行日 2023-03-03 12:47:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV パーマリンク