要約
文書レベルの関係抽出 (DocRE) は、文の境界を越えたエンティティ間の関係の識別と抽出に関係する、自然言語処理 (NLP) の活発な研究分野です。
従来の文レベルの関係抽出と比較して、DocRE は分析のためのより広範なコンテキストを提供しますが、複数の文または段落にまたがる可能性のある関係の特定が含まれるため、より困難です。
このタスクは、エンティティ間の関係をより深く理解するために、構造化されていない大規模文書 (科学論文、法律契約書、ニュース記事など) から知識ベースを自動的に構築して取り込む実行可能なソリューションとして関心が高まっています。
この文書は、文レベルの関係抽出と比較して、この分野のさまざまな応用例を強調しながら、この分野の最近の進歩の包括的な概要を提供することを目的としています。
要約(オリジナル)
Document-level relation extraction (DocRE) is an active area of research in natural language processing (NLP) concerned with identifying and extracting relationships between entities beyond sentence boundaries. Compared to the more traditional sentence-level relation extraction, DocRE provides a broader context for analysis and is more challenging because it involves identifying relationships that may span multiple sentences or paragraphs. This task has gained increased interest as a viable solution to build and populate knowledge bases automatically from unstructured large-scale documents (e.g., scientific papers, legal contracts, or news articles), in order to have a better understanding of relationships between entities. This paper aims to provide a comprehensive overview of recent advances in this field, highlighting its different applications in comparison to sentence-level relation extraction.
arxiv情報
著者 | Julien Delaunay,Hanh Thi Hong Tran,Carlos-Emiliano González-Gallardo,Georgeta Bordea,Nicolas Sidere,Antoine Doucet |
発行日 | 2023-10-12 13:39:39+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google