要約
深層学習技術の急速な発展に伴い、固有表現認識 (NER) は情報抽出タスクにおいてますます重要になってきています。
NER タスクが直面する最大の困難は、馴染みのない NE やドキュメントの種類であっても検出可能性を維持することです。
特異性情報には単語の潜在的な意味が含まれ、単語埋め込みの意味関連の特徴が生成される可能性があることを認識し、分布を意識した単語埋め込みを開発し、NER フレームワークで分布情報を利用するための 3 つの異なる方法を実装します。
そして、その結果は、単語特異性を既存の NER 手法に組み込むと、NER のパフォーマンスが向上することを示しています。
要約(オリジナル)
With the fast development of Deep Learning techniques, Named Entity Recognition (NER) is becoming more and more important in the information extraction task. The greatest difficulty that the NER task faces is to keep the detectability even when types of NE and documents are unfamiliar. Realizing that the specificity information may contain potential meanings of a word and generate semantic-related features for word embedding, we develop a distribution-aware word embedding and implement three different methods to make use of the distribution information in a NER framework. And the result shows that the performance of NER will be improved if the word specificity is incorporated into existing NER methods.
arxiv情報
著者 | Xin Chen,Qi Zhao,Xinyang Liu |
発行日 | 2024-01-22 01:23:23+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google