要約
イベント抽出は、高品質の注釈が不足しているテキストから、事前定義されたイベント トリガーと引数を認識することを目的としています。
ほとんどの NLP アプリケーションでは、大規模な合成トレーニング データを使用することが、データ不足の問題を軽減するための実用的かつ効果的なアプローチです。
しかし、イベント抽出のタスクに適用する場合、最近のデータ拡張手法は文法上の誤り、構造の不整合、意味論的な漂流の問題を無視することが多く、満足のいくパフォーマンスが得られません。
これらの問題を解決するために、イベント抽出DAEE用のノイズ除去された構造からテキストへの拡張フレームワークを提案します。このフレームワークは、知識ベースの構造からテキストへの生成モデルを通じて追加のトレーニングデータを生成し、生成されたデータから効果的なサブセットを繰り返し選択します。
深層強化学習エージェントを使用します。
いくつかのデータセットに関する実験結果は、提案された方法がイベント抽出のためにより多様なテキスト表現を生成し、最先端の方法と同等の結果を達成することを実証しています。
要約(オリジナル)
Event extraction aims to recognize pre-defined event triggers and arguments from texts, which suffer from the lack of high-quality annotations. In most NLP applications, involving a large scale of synthetic training data is a practical and effective approach to alleviate the problem of data scarcity. However, when applying to the task of event extraction, recent data augmentation methods often neglect the problem of grammatical incorrectness, structure misalignment, and semantic drifting, leading to unsatisfactory performances. In order to solve these problems, we propose a denoised structure-to-text augmentation framework for event extraction DAEE, which generates additional training data through the knowledge-based structure-to-text generation model and selects the effective subset from the generated data iteratively with a deep reinforcement learning agent. Experimental results on several datasets demonstrate that the proposed method generates more diverse text representations for event extraction and achieves comparable results with the state-of-the-art.
arxiv情報
著者 | bo wang,Heyan Huang,Xiaochi Wei,Ge Shi,Xiao Liu,Chong Feng,Tong Zhou,Shuaiqiang Wang,Dawei Yin |
発行日 | 2023-05-16 16:52:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google