要約
科学論文の自動要約に対する現在のアプローチでは、要約の形式で有益な要約が生成されます。
ただし、抄録は、論文とその中で引用されている参考文献との関係を示すことを目的としたものではありません。
我々は、参考文献の引用を含む特定の文(いわゆる「引用」)を条件とした有益な要約を生成できる、新しい文脈化された要約アプローチを提案します。
この要約は、引用場所に関連する引用論文の内容を概説します。
したがって、私たちのアプローチは、論文の引用を抽出してモデル化し、引用された論文から関連する文章を取得し、各引用に合わせた抽象的な要約を生成します。
$\textbf{Webis-Context-SciSumm-2023}$ を使用してアプローチを評価します。これは、54 万件のコンピューター サイエンス論文と 460 万件のシタンスを含む新しいデータセットです。
要約(オリジナル)
Current approaches to automatic summarization of scientific papers generate informative summaries in the form of abstracts. However, abstracts are not intended to show the relationship between a paper and the references cited in it. We propose a new contextualized summarization approach that can generate an informative summary conditioned on a given sentence containing the citation of a reference (a so-called “citance”). This summary outlines the content of the cited paper relevant to the citation location. Thus, our approach extracts and models the citances of a paper, retrieves relevant passages from cited papers, and generates abstractive summaries tailored to each citance. We evaluate our approach using $\textbf{Webis-Context-SciSumm-2023}$, a new dataset containing 540K~computer science papers and 4.6M~citances therein.
arxiv情報
著者 | Shahbaz Syed,Ahmad Dawar Hakimi,Khalid Al-Khatib,Martin Potthast |
発行日 | 2023-11-09 09:23:31+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google