要約
ディープ ラーニング (DL) は、最近、自然言語処理 (NLP) とコンピューター ビジョン (CV) の分野を支配しています。
ただし、DL は通常、大規模なデータ注釈の可用性に依存しているため、他の代替または補完的なパターンベースの手法が結果の改善に役立ちます。
このホワイト ペーパーでは、DL とルールベースの修正の両方を使用して、購入ドキュメントのキー情報抽出 (KIE) を構築します。
当社のシステムは、最初に光学式文字認識 (OCR) とエンティティのタグ付けに基づくテキストの理解を信頼して、関心のある購入事実 (製品コード、説明、数量、価格など) を識別します。
次に、これらの事実は同じ製品グループにリンクされます。これは、ライン検出といくつかのグループ化ヒューリスティックによって認識されます。
これらの DL アプローチが処理されると、ベースライン DL 予測を改善するためのルールベースの修正で構成されるいくつかのメカニズムに貢献します。
公開および NielsenIQ データセットからの購入ドキュメントの提示された実験で、ベースライン DL の結果に対するこれらのルールベースの修正によって提供される機能強化を証明します。
要約(オリジナル)
Deep Learning (DL) is dominating the fields of Natural Language Processing (NLP) and Computer Vision (CV) in the recent times. However, DL commonly relies on the availability of large data annotations, so other alternative or complementary pattern-based techniques can help to improve results. In this paper, we build upon Key Information Extraction (KIE) in purchase documents using both DL and rule-based corrections. Our system initially trusts on Optical Character Recognition (OCR) and text understanding based on entity tagging to identify purchase facts of interest (e.g., product codes, descriptions, quantities, or prices). These facts are then linked to a same product group, which is recognized by means of line detection and some grouping heuristics. Once these DL approaches are processed, we contribute several mechanisms consisting of rule-based corrections for improving the baseline DL predictions. We prove the enhancements provided by these rule-based corrections over the baseline DL results in the presented experiments for purchase documents from public and NielsenIQ datasets.
arxiv情報
| 著者 | Roberto Arroyo,Javier Yebes,Elena Martínez,Héctor Corrales,Javier Lorenzo |
| 発行日 | 2022-10-07 10:51:38+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google