SurveySum: A Dataset for Summarizing Multiple Scientific Articles into a Survey Section

要約

文書の要約は、テキストを簡潔で有益な要約に短縮するタスクです。
この論文では、複数の科学論文を調査のセクションに要約するために設計された新しいデータセットを紹介します。
私たちの貢献は次のとおりです。(1) SurveySum、ドメイン固有の集計ツールのギャップに対処する新しいデータセット。
(2) 科学論文を調査のセクションに要約するための 2 つの特定のパイプライン。
(3) パフォーマンスを比較するために複数の指標を使用してこれらのパイプラインを評価します。
私たちの結果は、高品質の検索段階の重要性と、生成される概要の品質に対するさまざまな構成の影響を浮き彫りにしています。

要約(オリジナル)

Document summarization is a task to shorten texts into concise and informative summaries. This paper introduces a novel dataset designed for summarizing multiple scientific articles into a section of a survey. Our contributions are: (1) SurveySum, a new dataset addressing the gap in domain-specific summarization tools; (2) two specific pipelines to summarize scientific articles into a section of a survey; and (3) the evaluation of these pipelines using multiple metrics to compare their performance. Our results highlight the importance of high-quality retrieval stages and the impact of different configurations on the quality of generated summaries.

arxiv情報

著者 Leandro Carísio Fernandes,Gustavo Bartz Guedes,Thiago Soares Laitz,Thales Sales Almeida,Rodrigo Nogueira,Roberto Lotufo,Jayr Pereira
発行日 2024-08-29 11:13:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク