Enhancing Low-resource Fine-grained Named Entity Recognition by Leveraging Coarse-grained Datasets

要約

固有表現認識 (NER) は、特に粒度の細かい NER シナリオにおいて、ラベル付きデータが不十分であるという問題に頻繁に悩まされます。
$K$ ショット学習手法は適用できますが、アノテーションの数が数十ラベルを超えるとパフォーマンスが飽和する傾向があります。
この問題を克服するために、多数のアノテーションを提供する既存の粗粒データセットを利用します。
この問題に対処する直接的なアプローチは、表現学習に粗粒データを使用する事前微調整です。
ただし、細粒度のエンティティ タイプは粗粒度のエンティティ タイプのサブカテゴリである可能性が高くなりますが、細粒度のエンティティと粗粒度のエンティティ間の関係を直接利用することはできません。
階層構造を明示的に活用するために、Fine-to-Coarse(F2C)マッピング行列を備えたきめの細かい NER モデルを提案します。
さらに、パフォーマンスの低下を避けるために、粒度の細かいエンティティ タイプと矛盾する粒度の粗いエンティティを除去する不一致フィルタリング方法を紹介します。
私たちの実験結果は、少数のきめの細かいアノテーションを扱う場合、私たちの方法が $K$ ショット学習と教師あり学習の両方の方法よりも優れていることを示しています。

要約(オリジナル)

Named Entity Recognition (NER) frequently suffers from the problem of insufficient labeled data, particularly in fine-grained NER scenarios. Although $K$-shot learning techniques can be applied, their performance tends to saturate when the number of annotations exceeds several tens of labels. To overcome this problem, we utilize existing coarse-grained datasets that offer a large number of annotations. A straightforward approach to address this problem is pre-finetuning, which employs coarse-grained data for representation learning. However, it cannot directly utilize the relationships between fine-grained and coarse-grained entities, although a fine-grained entity type is likely to be a subcategory of a coarse-grained entity type. We propose a fine-grained NER model with a Fine-to-Coarse(F2C) mapping matrix to leverage the hierarchical structure explicitly. In addition, we present an inconsistency filtering method to eliminate coarse-grained entities that are inconsistent with fine-grained entity types to avoid performance degradation. Our experimental results show that our method outperforms both $K$-shot learning and supervised learning methods when dealing with a small number of fine-grained annotations.

arxiv情報

著者 Su Ah Lee,Seokjin Oh,Woohwan Jung
発行日 2023-11-13 13:18:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク