要約
情報抽出 (IE) は、単純な自然言語テキストから構造的な知識 (エンティティ、関係、イベントなど) を抽出することを目的としています。
最近、生成大規模言語モデル (LLM) は、テキストの理解と生成において顕著な機能を実証し、さまざまなドメインやタスクにわたる一般化を可能にしました。
その結果、LLM の能力を活用し、生成パラダイムに基づいた IE タスクの実行可能なソリューションを提供するための多くの研究が提案されています。
IE タスクに対する LLM の取り組みの包括的な体系的なレビューと調査を行うために、この研究では、この分野の最新の進歩を調査します。
まず、これらの作業をさまざまな IE サブタスクと学習パラダイムの観点から分類することで広範な概要を示し、次に最も先進的な方法を実証的に分析し、LLM を使用した IE タスクの新たな傾向を発見します。
実施された徹底的なレビューに基づいて、私たちは将来の研究でさらなる探求に値する技術と有望な研究の方向性に関するいくつかの洞察を特定しました。
私たちはパブリック リポジトリを維持し、\url{https://github.com/quqxui/Awesome-LLM4IE-Papers} で関連リソースを継続的に更新しています。
要約(オリジナル)
Information extraction (IE) aims to extract structural knowledge (such as entities, relations, and events) from plain natural language texts. Recently, generative Large Language Models (LLMs) have demonstrated remarkable capabilities in text understanding and generation, allowing for generalization across various domains and tasks. As a result, numerous works have been proposed to harness abilities of LLMs and offer viable solutions for IE tasks based on a generative paradigm. To conduct a comprehensive systematic review and exploration of LLM efforts for IE tasks, in this study, we survey the most recent advancements in this field. We first present an extensive overview by categorizing these works in terms of various IE subtasks and learning paradigms, then we empirically analyze the most advanced methods and discover the emerging trend of IE tasks with LLMs. Based on thorough review conducted, we identify several insights in technique and promising research directions that deserve further exploration in future studies. We maintain a public repository and consistently update related resources at: \url{https://github.com/quqxui/Awesome-LLM4IE-Papers}.
arxiv情報
| 著者 | Derong Xu,Wei Chen,Wenjun Peng,Chao Zhang,Tong Xu,Xiangyu Zhao,Xian Wu,Yefeng Zheng,Enhong Chen |
| 発行日 | 2023-12-29 14:25:22+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google