Structure Diagram Recognition in Financial Announcements




– 金融知識グラフを構築し、様々な金融アプリケーションの効率を向上するためには、金融報告書において構造図から正確に構造化データを抽出することが必要である。
– 新たな手法を提案し、構造図に含まれる異なる種類の接続線(直線、曲線、異なる方向や角度のポリラインなど)をより正確に検出・抽出することができる。
– 中国の金融報告書から業界初のベンチマークとなる構造図を効率的に生成するための2段階の手法を開発し、自動ツールによる大量の図の合成と注釈付けで予備認識モデルをトレーニングし、その後、予備モデルを使用して実世界の構造図に自動的に注釈をつけて少数の手動修正を行うことで高品質のベンチマークを作成することができる。
– 実験的に、以前の手法よりも構造図の認識方法において非常に優れた性能を発揮することが確認された。


Accurately extracting structured data from structure diagrams in financial announcements is of great practical importance for building financial knowledge graphs and further improving the efficiency of various financial applications. First, we proposed a new method for recognizing structure diagrams in financial announcements, which can better detect and extract different types of connecting lines, including straight lines, curves, and polylines of different orientations and angles. Second, we developed a two-stage method to efficiently generate the industry’s first benchmark of structure diagrams from Chinese financial announcements, where a large number of diagrams were synthesized and annotated using an automated tool to train a preliminary recognition model with fairly good performance, and then a high-quality benchmark can be obtained by automatically annotating the real-world structure diagrams using the preliminary model and then making few manual corrections. Finally, we experimentally verified the significant performance advantage of our structure diagram recognition method over previous methods.


著者 Meixuan Qiao,Jun Wang,Junfu Xiang,Qiyu Hou,Ruixuan Li
発行日 2023-04-26 02:04:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV, cs.LG パーマリンク