Large Margin Prototypical Network for Few-shot Relation Classification with Fine-grained Features

要約

関係分類 (RC) は、自然言語の理解とナレッジ グラフの完成の両方において極めて重要な役割を果たします。
これは一般に、自由文に現れる 2 つの対象となるエンティティ間の関係を認識するタスクとして定式化されます。
RC に対する従来のアプローチは、特徴量エンジニアリングまたは深層学習ベースに関係なく、一般的なタイプの関係を分類する際に有望なパフォーマンスを得ることができますが、トレーニング用のラベル付きインスタンスが不十分なために認識できないロングテール関係の大部分が残ります。
この論文では、数ショット学習は RC にとって実用的に非常に重要であると考え、したがって数ショット RC 用の計量学習の最新のフレームワークを改善します。
具体的には、ロングテール関係をうまく一般化できることを期待して、きめ細かい機能を備えた利益率の高い ProtoNet を採用します。
私たちのフレームワークである LM-ProtoNet (FGF) を評価するために、大規模な教師付き少数ショット RC データセットである FewRel によって広範な実験が実施されました。
結果は、多くのベースライン アプローチに比べて大幅な改善を達成できることを示しています。

要約(オリジナル)

Relation classification (RC) plays a pivotal role in both natural language understanding and knowledge graph completion. It is generally formulated as a task to recognize the relationship between two entities of interest appearing in a free-text sentence. Conventional approaches on RC, regardless of feature engineering or deep learning based, can obtain promising performance on categorizing common types of relation leaving a large proportion of unrecognizable long-tail relations due to insufficient labeled instances for training. In this paper, we consider few-shot learning is of great practical significance to RC and thus improve a modern framework of metric learning for few-shot RC. Specifically, we adopt the large-margin ProtoNet with fine-grained features, expecting they can generalize well on long-tail relations. Extensive experiments were conducted by FewRel, a large-scale supervised few-shot RC dataset, to evaluate our framework: LM-ProtoNet (FGF). The results demonstrate that it can achieve substantial improvements over many baseline approaches.

arxiv情報

著者 Miao Fan,Yeqi Bai,Mingming Sun,Ping Li
発行日 2024-09-06 03:28:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク