ParaRev: Building a dataset for Scientific Paragraph Revision annotated with revision instruction

要約

改訂は科学論文の重要なステップであり、著者は研究内容を改良して、明瞭さ、構造、学術的な質を向上させます。
自動執筆支援に対する既存のアプローチは、多くの場合、文章レベルの改訂に焦点を当てており、効果的な修正に必要なより広範なコンテキストを捉えることができません。
この論文では、科学文書の改訂作業において、範囲を文レベルから段落レベルに移行した場合の影響を調査します。
タスクの段落レベルの定義により、より有意義な変更が可能になり、一般的な変更指示ではなく、詳細な改訂指示に従ってガイドされます。
このタスクをサポートするために、改訂指示が手動で注釈付けされた評価サブセットを含む、改訂された科学パラグラフの最初のデータセットである ParaRev を紹介します。
私たちの実験では、考慮したモデルや指標に関係なく、詳細な指示を使用すると、一般的なアプローチと比較して自動リビジョンの品質が大幅に向上することが実証されました。

要約(オリジナル)

Revision is a crucial step in scientific writing, where authors refine their work to improve clarity, structure, and academic quality. Existing approaches to automated writing assistance often focus on sentence-level revisions, which fail to capture the broader context needed for effective modification. In this paper, we explore the impact of shifting from sentence-level to paragraph-level scope for the task of scientific text revision. The paragraph level definition of the task allows for more meaningful changes, and is guided by detailed revision instructions rather than general ones. To support this task, we introduce ParaRev, the first dataset of revised scientific paragraphs with an evaluation subset manually annotated with revision instructions. Our experiments demonstrate that using detailed instructions significantly improves the quality of automated revisions compared to general approaches, no matter the model or the metric considered.

arxiv情報

著者 Léane Jourdan,Nicolas Hernandez,Richard Dufour,Florian Boudin,Akiko Aizawa
発行日 2025-01-09 13:19:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク