SumREN: Summarizing Reported Speech about Events in News

要約

ニュース記事の主な目的は、特定のイベントの詳細 (つまり、イベントに関する 5 つの W: 誰が、何を、どこで、いつ、なぜ) と、人々がどのように
それに反応した(つまり、報告された声明)。
ただし、ニュースの要約に関する既存の作業は、ほぼもっぱらイベントの詳細に焦点を当てています。
この作業では、報告されたステートメントによって表される、特定のイベントに対するさまざまなスピーカーの反応を要約するという新しいタスクを提案します。
この目的のために、132 の出来事を議論する 633 のニュース記事から得られたさまざまな著名人から報告された声明の 745 の要約で構成される、新しい複数文書の要約ベンチマークである SUMREN を作成します。
私たちは、BART のような小さなモデルがこのタスクで GPT-3 レベルのパフォーマンスを達成するのに役立つ、タスク用の自動シルバー トレーニング データ生成アプローチを提案します。
最後に、報告された音声を要約するためのパイプラインベースのフレームワークを紹介します。これは、ベースラインのクエリに焦点を当てた要約アプローチよりも抽象的で事実に基づいた要約を生成することを経験的に示しています。

要約(オリジナル)

A primary objective of news articles is to establish the factual record for an event, frequently achieved by conveying both the details of the specified event (i.e., the 5 Ws; Who, What, Where, When and Why regarding the event) and how people reacted to it (i.e., reported statements). However, existing work on news summarization almost exclusively focuses on the event details. In this work, we propose the novel task of summarizing the reactions of different speakers, as expressed by their reported statements, to a given event. To this end, we create a new multi-document summarization benchmark, SUMREN, comprising 745 summaries of reported statements from various public figures obtained from 633 news articles discussing 132 events. We propose an automatic silver training data generation approach for our task, which helps smaller models like BART achieve GPT-3 level performance on this task. Finally, we introduce a pipeline-based framework for summarizing reported speech, which we empirically show to generate summaries that are more abstractive and factual than baseline query-focused summarization approaches.

arxiv情報

著者 Revanth Gangi Reddy,Heba Elfardy,Hou Pong Chan,Kevin Small,Heng Ji
発行日 2023-03-08 03:54:24+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク