BED: Bi-Encoder-Decoder Model for Canonical Relation Extraction

要約

正準関係抽出は、文から関係トリプルを抽出することを目的としており、トリプル要素 (エンティティのペアとその関係) が知識ベースにマッピングされます。
最近、エンコーダ-デコーダアーキテクチャに基づく方法が提案され、有望な結果が得られています。
しかし、これらの方法ではエンティティ情報を十分に活用することができず、単に拡張されたトレーニングデータとして使用されるだけです。
さらに、埋め込みが学習されていないため、新しいエンティティを表すことができません。
本稿では、上記の問題を解決するための新しいフレームワークである Bi-Encoder-Decoder (BED) を提案します。
具体的には、エンティティ情報を最大限に活用するために、エンコーダを使用してこの情報のセマンティクスをエンコードし、高品質なエンティティ表現を実現します。
新しいエンティティの場合、トレーニングされたエンティティ エンコーダがあれば、その表現を簡単に生成できます。
2 つのデータセットに関する実験結果は、私たちの方法が以前の最先端のものよりも大幅なパフォーマンスの向上を達成し、再トレーニングなしで新しいエンティティを適切に処理できることを示しています。

要約(オリジナル)

Canonical relation extraction aims to extract relational triples from sentences, where the triple elements (entity pairs and their relationship) are mapped to the knowledge base. Recently, methods based on the encoder-decoder architecture are proposed and achieve promising results. However, these methods cannot well utilize the entity information, which is merely used as augmented training data. Moreover, they are incapable of representing novel entities, since no embeddings have been learned for them. In this paper, we propose a novel framework, Bi-Encoder-Decoder (BED), to solve the above issues. Specifically, to fully utilize entity information, we employ an encoder to encode semantics of this information, leading to high-quality entity representations. For novel entities, given a trained entity encoder, their representations can be easily generated. Experimental results on two datasets show that, our method achieves a significant performance improvement over the previous state-of-the-art and handle novel entities well without retraining.

arxiv情報

著者 Nantao Zheng,Siyu Long,Xinyu Dai
発行日 2023-12-12 09:14:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク