BitCoin: Bidirectional Tagging and Supervised Contrastive Learning based Joint Relational Triple Extraction Framework

要約

関係トリプル抽出 (RTE) は、情報抽出とナレッジ グラフの構築において不可欠なタスクです。
最近の進歩にもかかわらず、既存の方法には依然として一定の制限があります。
一般化された事前トレーニングされたモデルを採用しているだけで、RTE タスクの特異性は考慮されていません。
さらに、既存のタグ付けベースのアプローチは通常、RTE タスクを 2 つのサブタスクに分解し、最初にサブジェクトを識別し、続いてオブジェクトと関係を識別します。
彼らは、主語から目的語への関係トリプルの抽出にのみ焦点を当てており、主語の抽出が失敗すると、その主語に関連付けられたすべてのトリプルの抽出も失敗するということを無視しています。
これらの問題に対処するために、私たちは革新的な双方向タグ付けと教師あり対照学習ベースの共同リレーショナル トリプル抽出フレームワークである BitCoin を提案します。
具体的には、アンカーごとに 1 つのポジティブに限定するのではなく、複数のポジティブを考慮する教師あり対比学習方法を設計します。
さらに、主語と目的語の間の過度の類似性を防ぐために、ペナルティ項が導入されます。
私たちのフレームワークは 2 方向のタガーを実装し、サブジェクトからオブジェクトへ、およびオブジェクトからサブジェクトへのトリプル抽出を可能にします。
実験結果は、BitCoin がベンチマーク データセットで最先端の結果を達成し、Normal、SEO、EPO、および複数の関係抽出タスクで F1 スコアを大幅に向上させることを示しています。

要約(オリジナル)

Relation triple extraction (RTE) is an essential task in information extraction and knowledge graph construction. Despite recent advancements, existing methods still exhibit certain limitations. They just employ generalized pre-trained models and do not consider the specificity of RTE tasks. Moreover, existing tagging-based approaches typically decompose the RTE task into two subtasks, initially identifying subjects and subsequently identifying objects and relations. They solely focus on extracting relational triples from subject to object, neglecting that once the extraction of a subject fails, it fails in extracting all triples associated with that subject. To address these issues, we propose BitCoin, an innovative Bidirectional tagging and supervised Contrastive learning based joint relational triple extraction framework. Specifically, we design a supervised contrastive learning method that considers multiple positives per anchor rather than restricting it to just one positive. Furthermore, a penalty term is introduced to prevent excessive similarity between the subject and object. Our framework implements taggers in two directions, enabling triples extraction from subject to object and object to subject. Experimental results show that BitCoin achieves state-of-the-art results on the benchmark datasets and significantly improves the F1 score on Normal, SEO, EPO, and multiple relation extraction tasks.

arxiv情報

著者 Luyao He,Zhongbao Zhang,Sen Su,Yuxin Chen
発行日 2023-09-21 07:55:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク