Asking and Answering Questions to Extract Event-Argument Structures

要約

この論文では、文書レベルのイベントと引数の構造を抽出するための質問応答アプローチを紹介します。
イベントに含まれる可能性のある引数の種類ごとに、自動的に質問と回答が行われます。
質問は、手動で定義されたテンプレートと生成トランスフォーマーを使用して生成されます。
テンプレートベースの質問は、事前定義されたロール固有の wh-word とコンテキスト ドキュメントからのイベント トリガーを使用して生成されます。
トランスフォーマーベースの質問は、一節と予想される回答に基づいて質問を作成するようにトレーニングされた大規模な言語モデルを使用して生成されます。
さらに、文間のイベントと引数の関係に特化した新しいデータ拡張戦略を開発します。
シンプルなスパンスワッピング手法、相互参照解決、および大規模な言語モデルを使用して、トレーニング インスタンスを強化します。
私たちのアプローチにより、コーパス固有の変更を加えることなく転移学習が可能になり、RAMS データセットと競合する結果が得られます。
以前の作業よりも優れたパフォーマンスを発揮し、イベント トリガーとは異なる文に出現する引数を抽出するのに特に有益です。
また、最良のモデルによって発生する最も一般的なエラーを明らかにする詳細な定量的分析と定性的分析も紹介します。

要約(オリジナル)

This paper presents a question-answering approach to extract document-level event-argument structures. We automatically ask and answer questions for each argument type an event may have. Questions are generated using manually defined templates and generative transformers. Template-based questions are generated using predefined role-specific wh-words and event triggers from the context document. Transformer-based questions are generated using large language models trained to formulate questions based on a passage and the expected answer. Additionally, we develop novel data augmentation strategies specialized in inter-sentential event-argument relations. We use a simple span-swapping technique, coreference resolution, and large language models to augment the training instances. Our approach enables transfer learning without any corpora-specific modifications and yields competitive results with the RAMS dataset. It outperforms previous work, and it is especially beneficial to extract arguments that appear in different sentences than the event trigger. We also present detailed quantitative and qualitative analyses shedding light on the most common errors made by our best model.

arxiv情報

著者 Md Nayem Uddin,Enfa Rose George,Eduardo Blanco,Steven Corman
発行日 2024-04-25 08:43:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク