要約
臨床の名前付きエンティティ認識(NER)は、臨床ナラティブ内の重要なエンティティを検索することを目的としている。最近の研究により、大規模言語モデル(LLM)がこのタスクで強力な性能を達成できることが実証されている。これまでの研究が独自のLLMに焦点を当てているのに対し、我々は、エンティティ認識のために特別に訓練されたオープンなNER LLMが臨床NERでどのように機能するかを調査する。本論文では、フィルタリングを伴うエンティティ分解(EDF)という新しいフレームワークにより、LLMの性能向上を目指す。我々の重要なアイデアは、エンティティ認識タスクをサブエンティティタイプの複数の検索に分解することである。また、不正なエンティティを除去するためのフィルタリング機構を導入する。我々の実験結果は、全てのメトリクス、モデル、データセット、エンティティタイプにおいて、我々のフレームワークの有効性を実証している。我々の分析により、エンティティ分解により、以前は見逃していたエンティティを大幅に改善しながら認識できることが明らかになった。さらに、我々のフレームワークの包括的な評価と、将来の研究のための詳細なエラー分析を提供する。
要約(オリジナル)
Clinical named entity recognition (NER) aims to retrieve important entities within clinical narratives. Recent works have demonstrated that large language models (LLMs) can achieve strong performance in this task. While previous works focus on proprietary LLMs, we investigate how open NER LLMs, trained specifically for entity recognition, perform in clinical NER. In this paper, we aim to improve them through a novel framework, entity decomposition with filtering, or EDF. Our key idea is to decompose the entity recognition task into several retrievals of sub-entity types. We also introduce a filtering mechanism to remove incorrect entities. Our experimental results demonstrate the efficacy of our framework across all metrics, models, datasets, and entity types. Our analysis reveals that entity decomposition can recognize previously missed entities with substantial improvement. We further provide a comprehensive evaluation of our framework and an in-depth error analysis to pave future works.
arxiv情報
著者 | Reza Averly,Xia Ning |
発行日 | 2024-07-05 16:38:23+00:00 |
arxivサイト | arxiv_id(pdf) |