要約
テキストから関係トリプル (主語、述語、目的語) を抽出すると、非構造化テキスト データを構造化された知識に変換できます。
固有表現認識 (NER) と関係抽出 (RE) は、この知識生成パイプラインの 2 つの基本的なサブタスクです。
サブタスクの統合は、それらの性質が異なるため、かなりの課題を引き起こします。
この論文では、依存関係解析とグラフ再帰ニューラル ネットワーク (GRNN) の構造情報を利用して、トリプル抽出タスクをグラフ ラベリング問題に変換する新しいアプローチを紹介します。
サブタスクを統合するために、本論文では、モデルトレーニング中の推論操作によってサブタスクの表現を接続する動的フィードバックフォレストアルゴリズムを提案します。
実験結果は、提案された方法の有効性を示しています。
要約(オリジナル)
Extracting relational triples (subject, predicate, object) from text enables the transformation of unstructured text data into structured knowledge. The named entity recognition (NER) and the relation extraction (RE) are two foundational subtasks in this knowledge generation pipeline. The integration of subtasks poses a considerable challenge due to their disparate nature. This paper presents a novel approach that converts the triple extraction task into a graph labeling problem, capitalizing on the structural information of dependency parsing and graph recursive neural networks (GRNNs). To integrate subtasks, this paper proposes a dynamic feedback forest algorithm that connects the representations of subtasks by inference operations during model training. Experimental results demonstrate the effectiveness of the proposed method.
arxiv情報
著者 | Hongyin Zhu |
発行日 | 2023-08-22 13:00:13+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google