要約
関係抽出の目的は、2 つのエンティティ間の関係を事前定義されたカテゴリに分類することです。
従来の研究は主に文レベルの関係抽出に焦点を当てていましたが、最近の研究では範囲を文書レベルの関係抽出に拡大しています。
従来の関係抽出方法は人間が注釈を付けたトレーニング データに大きく依存しており、時間と労力がかかります。
手動による注釈の必要性を軽減するために、最近の弱い教師付きアプローチが文レベルの関係抽出に対して開発されていますが、文書レベルの関係抽出については限定的な作業が行われています。
弱い教師付きの文書レベルの関係抽出は、「関係なし」インスタンスの数が不均衡であることと、文書関係を抽出するための事前学習済みの大規模言語モデルを直接調査できないことにより、重大な課題に直面しています。
これらの課題に対処するために、我々は、プロンプトベースの技術とデータプログラミングを組み合わせた、新しい弱く監視されたドキュメントレベルの関係抽出方法である PromptRE を提案します。
さらに、PromptRE には、パフォーマンスを向上させるための事前知識として、ラベルの分布とエンティティの種類が組み込まれています。
プロンプトとデータ プログラミングの両方の長所を活用することで、PromptRE は関係分類のパフォーマンスの向上を実現し、「関係なし」問題を効果的に処理します。
ドキュメントレベルの関係抽出のベンチマーク データセットである ReDocRED の実験結果は、ベースライン アプローチに対する PromptRE の優位性を示しています。
要約(オリジナル)
Relation extraction aims to classify the relationships between two entities into pre-defined categories. While previous research has mainly focused on sentence-level relation extraction, recent studies have expanded the scope to document-level relation extraction. Traditional relation extraction methods heavily rely on human-annotated training data, which is time-consuming and labor-intensive. To mitigate the need for manual annotation, recent weakly-supervised approaches have been developed for sentence-level relation extraction while limited work has been done on document-level relation extraction. Weakly-supervised document-level relation extraction faces significant challenges due to an imbalanced number ‘no relation’ instances and the failure of directly probing pretrained large language models for document relation extraction. To address these challenges, we propose PromptRE, a novel weakly-supervised document-level relation extraction method that combines prompting-based techniques with data programming. Furthermore, PromptRE incorporates the label distribution and entity types as prior knowledge to improve the performance. By leveraging the strengths of both prompting and data programming, PromptRE achieves improved performance in relation classification and effectively handles the ‘no relation’ problem. Experimental results on ReDocRED, a benchmark dataset for document-level relation extraction, demonstrate the superiority of PromptRE over baseline approaches.
arxiv情報
著者 | Chufan Gao,Xulin Fan,Jimeng Sun,Xuan Wang |
発行日 | 2023-10-13 17:23:17+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google