要約
情報抽出 (IE) のプロセスは、非構造化およびラベル付けされていないデータから意味のある情報を抽出するためによく使用されます。
OCR や抽出エンジンの受け渡しなどの従来のデータ抽出方法は、大規模なデータに対して非効率的であり、限界があります。
この論文では、NLP も含む A2I およびコンピュータ ビジョン技術を使用した、独特の情報抽出手法を提案します。
要約(オリジナル)
Process of information extraction (IE) is often used to extract meaningful information from unstructured and unlabeled data. Conventional methods of data extraction including application of OCR and passing extraction engine, are inefficient on large data and have their limitation. In this paper, a peculiar technique of information extraction is proposed using A2I and computer vision technologies, which also includes NLP.
arxiv情報
著者 | Aditya Parikh |
発行日 | 2023-12-15 15:27:41+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google