SciNews: From Scholarly Complexities to Public Narratives — A Dataset for Scientific News Report Generation

要約

科学ニュースの報道は架け橋として機能し、複雑な研究​​記事をより広範な人々の共感を呼ぶレポートに巧みに翻訳します。
このような物語の自動生成により、学術的な洞察へのアクセスが強化されます。
この論文では、このパラダイムの開発を促進するための新しいコーパスを紹介します。
私たちのコーパスは、9 つ​​の分野にわたる学術出版物とそれに対応する科学ニュース レポートを並行して編集したもので構成されています。
データセットの有用性と信頼性を実証するために、私たちは広範な分析を実施し、科学ニュースの物語と学術論文の間の読みやすさと簡潔さの相違を強調しています。
最先端のテキスト生成モデルを使用してデータセットのベンチマークを行います。
評価プロセスには自動評価と人間による評価の両方が含まれており、これにより科学ニュース レポートの自動生成に関する将来の探求のための基礎が築かれます。
この研究に関連するデータセットとコードは、https://dongqi.me/projects/SciNews で入手できます。

要約(オリジナル)

Scientific news reports serve as a bridge, adeptly translating complex research articles into reports that resonate with the broader public. The automated generation of such narratives enhances the accessibility of scholarly insights. In this paper, we present a new corpus to facilitate this paradigm development. Our corpus comprises a parallel compilation of academic publications and their corresponding scientific news reports across nine disciplines. To demonstrate the utility and reliability of our dataset, we conduct an extensive analysis, highlighting the divergences in readability and brevity between scientific news narratives and academic manuscripts. We benchmark our dataset employing state-of-the-art text generation models. The evaluation process involves both automatic and human evaluation, which lays the groundwork for future explorations into the automated generation of scientific news reports. The dataset and code related to this work are available at https://dongqi.me/projects/SciNews.

arxiv情報

著者 Dongqi Liu,Yifan Wang,Jia Loy,Vera Demberg
発行日 2024-12-10 09:12:46+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク