EDeR: A Dataset for Exploring Dependency Relations Between Events

要約

タイトル: EDeR: イベントの依存関係を探索するためのデータセット
要約:
– 関係抽出は自然言語処理(NLP)と情報検索(IR)研究の中心的な課題である。
– しかし、これまでにNLPやIRの研究で探索されてこなかった重要な関係の一つは、イベントが他のイベントの引数(必須またはオプション)であるという関係である。
– 本研究では、この依存関係を提供する人の注釈付きデータセットである「Event Dependency Relation(EDeR)」を導入する。
– 注釈はOntoNotesデータセットのドキュメントのサンプルで行われ、このデータセットの既存の直交するアノテーションと統合することができる利点がある。
– イベントの依存関係を予測するためのベースライン手法を調査し、バイナリ引数/非引数分類において最高の精度が82.61であることを示す。
– この関係を認識することが、より正確なイベント抽出(意味役割ラベリング)につながり、共参照解決などこれに依存する後続のタスクを改善することができることも示される。
– さらに、必須引数、オプション引数、非引数の三つの分類を予測することがより難しいタスクであることを示している。

要約(オリジナル)

Relation extraction is a central task in natural language processing (NLP) and information retrieval (IR) research. We argue that an important type of relation not explored in NLP or IR research to date is that of an event being an argument – required or optional – of another event. We introduce the human-annotated Event Dependency Relation dataset (EDeR) which provides this dependency relation. The annotation is done on a sample of documents from the OntoNotes dataset, which has the added benefit that it integrates with existing, orthogonal, annotations of this dataset. We investigate baseline approaches for predicting the event dependency relation, the best of which achieves an accuracy of 82.61 for binary argument/non-argument classification. We show that recognizing this relation leads to more accurate event extraction (semantic role labelling) and can improve downstream tasks that depend on this, such as co-reference resolution. Furthermore, we demonstrate that predicting the three-way classification into the required argument, optional argument or non-argument is a more challenging task.

arxiv情報

著者 Ruiqi Li,Patrik Haslum,Leyang Cui
発行日 2023-04-04 08:07:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク