要約
ナラティブには、時間と状況に応じて展開されるイベントの豊富なソースが含まれています。
これらのイベントを自動的に理解することで、さらなる計算 (推論など) のために物語を要約して理解することができます。
この論文では、イベントの情報ステータス (IS) を研究し、物語内の新しいイベントを自動的に識別するという新しい挑戦的なタスクを提案します。
イベントを主語、述語、目的語の 3 つの要素として定義します。
この出来事は、談話の文脈と常識的な推論によって推論できるかどうかの観点から、新しいものとして分類されます。
私たちは、ヒューマン アノテーターを使用して、公開されている物語のコーパスに文レベルで新しいイベントの注釈を付けました。
注釈プロトコルを提示し、注釈の品質とタスクの難易度を研究します。
物語を理解するための新しいイベント抽出のタスク用に、アノテーション付きデータセット、アノテーション マテリアル、機械学習ベースライン モデルを公開します。
要約(オリジナル)
Narratives include a rich source of events unfolding over time and context. Automatic understanding of these events provides a summarised comprehension of the narrative for further computation (such as reasoning). In this paper, we study the Information Status (IS) of the events and propose a novel challenging task: the automatic identification of new events in a narrative. We define an event as a triplet of subject, predicate, and object. The event is categorized as new with respect to the discourse context and whether it can be inferred through commonsense reasoning. We annotated a publicly available corpus of narratives with the new events at sentence level using human annotators. We present the annotation protocol and study the quality of the annotation and the difficulty of the task. We publish the annotated dataset, annotation materials, and machine learning baseline models for the task of new event extraction for narrative understanding.
arxiv情報
| 著者 | Seyed Mahed Mousavi,Shohei Tanaka,Gabriel Roccabruna,Koichiro Yoshino,Satoshi Nakamura,Giuseppe Riccardi | 
| 発行日 | 2023-08-08 08:08:12+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
