要約
物語には、時間と文脈の中で展開される豊富なイベント ソースが含まれます。
これらの出来事を自動的に理解することで、さらなる計算 (推論など) のための物語の要約された理解が得られる場合があります。
この論文では、イベントの情報ステータス (IS) を研究し、新しい挑戦的なタスクを提案します。それは、物語内の新しいイベントの自動識別です。
イベントは、主語、述語、および目的語のトリプレットとして定義されます。
この出来事は、談話の文脈と、常識的な推論を通じて推測できるかどうかに関して、新しいものとして分類されます。
ヒューマン・アノテーターを使用して、公開されている物語のコーパスに文レベルで新しいイベントに注釈を付けました。
注釈プロトコルと、注釈の品質とタスクの難しさを検証することを目的とした研究を紹介します。
注釈付きのデータセット、注釈資料、機械学習のベースライン モデルを公開して、物語を理解するための新しいイベントを抽出します。
要約(オリジナル)
Narratives include a rich source of events unfolding over time and context. Automatic understanding of these events may provide a summarised comprehension of the narrative for further computation (such as reasoning). In this paper, we study the Information Status (IS) of the events and propose a novel challenging task: the automatic identification of new events in a narrative. We define an event as a triplet of subject, predicate, and object. The event is categorized as new with respect to the discourse context and whether it can be inferred through commonsense reasoning. We annotated a publicly available corpus of narratives with the new events at sentence level using human annotators. We present the annotation protocol and a study aiming at validating the quality of the annotation and the difficulty of the task. We publish the annotated dataset, annotation materials, and machine learning baseline models for the task of new event extraction for narrative understanding.
arxiv情報
著者 | Seyed Mahed Mousavi,Shohei Tanaka,Gabriel Roccabruna,Koichiro Yoshino,Satoshi Nakamura,Giuseppe Riccardi |
発行日 | 2023-02-20 16:25:57+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google