‘Don’t Get Too Technical with Me’: A Discourse Structure-Based Framework for Science Journalism

要約

科学ジャーナリズムとは、科学論文の技術的な発見を、それほど技術的ではないニュース記事として一般の聴衆に報告する仕事を指します。
私たちは、この現実世界のタスク (つまり、自動科学ジャーナリズム) をサポートする自動化システムを設計することを目指しています。1) 新しく構築された現実世界のデータセット (SciTechNews) を、公開されている科学論文のタプルと、それに対応するデータセットを導入します。
ニュース記事と専門家が書いた短い要約のスニペット。
2) 論文の言説構造とそのメタデータを統合して生成をガイドする新しい技術的フレームワークを提案する。
3) 広範な自動実験と人体実験により、ターゲット視聴者にとって意味のあるコンテンツ計画を練り、選択した情報を簡素化し、一般向けのスタイルで一貫した最終レポートを作成する点で、当社のフレームワークが他のベースライン手法 (Alpaca や ChatGPT など) よりも優れていることを実証します。

要約(オリジナル)

Science journalism refers to the task of reporting technical findings of a scientific paper as a less technical news article to the general public audience. We aim to design an automated system to support this real-world task (i.e., automatic science journalism) by 1) introducing a newly-constructed and real-world dataset (SciTechNews), with tuples of a publicly-available scientific paper, its corresponding news article, and an expert-written short summary snippet; 2) proposing a novel technical framework that integrates a paper’s discourse structure with its metadata to guide generation; and, 3) demonstrating with extensive automatic and human experiments that our framework outperforms other baseline methods (e.g. Alpaca and ChatGPT) in elaborating a content plan meaningful for the target audience, simplifying the information selected, and producing a coherent final report in a layman’s style.

arxiv情報

著者 Ronald Cardenas,Bingsheng Yao,Dakuo Wang,Yufang Hou
発行日 2023-10-23 16:35:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク