Neural Approaches to Entity-Centric Information Extraction


– 人工知能(AI)は、音声アシスタント、顔認識、チャットボット、自動運転車などのアプリケーションにより、私たちの日常生活に大きな影響を与えています。
– 自然言語処理(NLP)は、AIと言語学のクロスディシプリンで、テキスト理解の研究に専心しています。この分野は、言語の構造の非構造化による問題、あいまいさ、角隅的なケースなどのため非常に難しいとされています。
– 本論文では、テキスト内のエンティティ(人、組織、場所の名前など)の理解について非常に特定の領域に取り組んでいます。
– 最初に、我々はテキスト内の単語1つずつの意味を理解するのではなく、エンティティ概念に基づいてアプリケーションを構築するべきという、根本的に異なるエンティティ中心の見方を紹介します。
– 次に、エンティティ中心のアプローチがエンティティリンキングタスクにどのように使用できるかについて、より詳細なモデルを紹介します。
– 我々の研究では、エンティティリンキングを、個々の言及ではなく共参照クラスタレベルで実行することで改善することができることを示します。
– 次に、ナレッジベースエンティティからの情報をテキストに統合する方法についてさらに研究を進めます。
– 最後に、時間的進化の観点からエンティティの進化を分析します。


Artificial Intelligence (AI) has huge impact on our daily lives with applications such as voice assistants, facial recognition, chatbots, autonomously driving cars, etc. Natural Language Processing (NLP) is a cross-discipline of AI and Linguistics, dedicated to study the understanding of the text. This is a very challenging area due to unstructured nature of the language, with many ambiguous and corner cases. In this thesis we address a very specific area of NLP that involves the understanding of entities (e.g., names of people, organizations, locations) in text. First, we introduce a radically different, entity-centric view of the information in text. We argue that instead of using individual mentions in text to understand their meaning, we should build applications that would work in terms of entity concepts. Next, we present a more detailed model on how the entity-centric approach can be used for the entity linking task. In our work, we show that this task can be improved by considering performing entity linking at the coreference cluster level rather than each of the mentions individually. In our next work, we further study how information from Knowledge Base entities can be integrated into text. Finally, we analyze the evolution of the entities from the evolving temporal perspective.


著者 Klim Zaporojets
発行日 2023-04-15 20:07:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CL パーマリンク