Empirical Study of Named Entity Recognition Performance Using Distribution-aware Word Embedding

要約

ディープ ラーニング技術の急速な発展に伴い、名前付きエンティティ認識 (NER) は、情報抽出タスクにおいてますます重要になっています。
NER タスクが直面する最大の困難は、NE とドキュメントのタイプが不慣れな場合でも検出可能性を維持することです。
特異性情報には単語の潜在的な意味が含まれており、単語埋め込み用のセマンティック関連の機能を生成する可能性があることを認識して、分布認識単語埋め込みを開発し、NER フレームワークで分布情報を利用する 3 つの異なる方法を実装します。
そして、その結果は、単語の特異性が既存の NER メソッドに組み込まれると、NER のパフォーマンスが向上することを示しています。

要約(オリジナル)

With the fast development of Deep Learning techniques, Named Entity Recognition (NER) is becoming more and more important in the information extraction task. The greatest difficulty that the NER task faces is to keep the detectability even when types of NE and documents are unfamiliar. Realizing that the specificity information may contain potential meanings of a word and generate semantic-related features for word embedding, we develop a distribution-aware word embedding and implement three different methods to make use of the distribution information in a NER framework. And the result shows that the performance of NER will be improved if the word specificity is incorporated into existing NER methods.

arxiv情報

著者 Xin Chen,Qi Zhao,Xinyang Liu
発行日 2023-03-17 09:32:37+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク