CompRes: A Dataset for Narrative Structure in News

要約

この論文では、生のテキスト内の物語構造を自動的に検出するタスクについて説明します。
これまでの研究では、ラボフとワレツキーによる口頭物語理論を利用して、個人的な物語のテキスト内のさまざまな物語要素を特定してきました。
代わりに、私たちはニュース記事に焦点を当てます。ニュース記事の増大する社会的影響と、世論の形成と形成におけるニュース記事の役割に動機付けられています。
CompRes を紹介します。CompRes は、ニュース メディアにおける物語構造の最初のデータセットです。
データセットが構築されるプロセスについて説明します。まず、ラボフとワレツキーの物語理論 (複雑さと解決) の要素を適応させ、
私たち自身(成功)。
次に、そのスキームを使用して、ニュースや党派の Web サイトから収集した 29 の英語ニュース記事 (1,099 文を含む) のセットに注釈を付けました。
アノテーション付きデータセットを使用していくつかの教師ありモデルをトレーニングし、さまざまな物語要素を識別し、最大 0.7 の $F_1$ スコアを達成しました。
最後に、将来の取り組みに向けていくつかの有望な方向性を提案します。

要約(オリジナル)

This paper addresses the task of automatically detecting narrative structures in raw texts. Previous works have utilized the oral narrative theory by Labov and Waletzky to identify various narrative elements in personal stories texts. Instead, we direct our focus to news articles, motivated by their growing social impact as well as their role in creating and shaping public opinion. We introduce CompRes — the first dataset for narrative structure in news media. We describe the process in which the dataset was constructed: first, we designed a new narrative annotation scheme, better suited for news media, by adapting elements from the narrative theory of Labov and Waletzky (Complication and Resolution) and adding a new narrative element of our own (Success); then, we used that scheme to annotate a set of 29 English news articles (containing 1,099 sentences) collected from news and partisan websites. We use the annotated dataset to train several supervised models to identify the different narrative elements, achieving an $F_1$ score of up to 0.7. We conclude by suggesting several promising directions for future work.

arxiv情報

著者 Effi Levi,Guy Mor,Shaul Shenhav,Tamir Sheafer
発行日 2023-11-07 13:29:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク