FREDSum: A Dialogue Summarization Corpus for French Political Debates

要約

深層学習の最近の進歩、特にエンコーダ/デコーダ アーキテクチャの発明により、抽象的要約システムのパフォーマンスが大幅に向上しました。
しかし、研究の大部分は書面による文書に焦点を当てており、多者間の対話の要約の問題は無視されています。
この論文では、多言語対話の要約のためのリソースを強化することを目的として、フランスの政治討論のデータセットを紹介します。
私たちのデータセットは、手動で転写され注釈が付けられた政治討論で構成されており、さまざまなトピックや視点をカバーしています。
私たちは、正確かつ効果的な対話要約モデルをトレーニングするための高品質の文字起こしと注釈の重要性を強調し、英語以外の言語での対話要約をサポートするための多言語リソースの必要性を強調します。
また、最先端の方法を使用したベースライン実験も提供し、対話要約の分野を前進させるためにこの分野でのさらなる研究を奨励します。
私たちのデータセットは、研究コミュニティが使用できるように公開されます。

要約(オリジナル)

Recent advances in deep learning, and especially the invention of encoder-decoder architectures, has significantly improved the performance of abstractive summarization systems. The majority of research has focused on written documents, however, neglecting the problem of multi-party dialogue summarization. In this paper, we present a dataset of French political debates for the purpose of enhancing resources for multi-lingual dialogue summarization. Our dataset consists of manually transcribed and annotated political debates, covering a range of topics and perspectives. We highlight the importance of high quality transcription and annotations for training accurate and effective dialogue summarization models, and emphasize the need for multilingual resources to support dialogue summarization in non-English languages. We also provide baseline experiments using state-of-the-art methods, and encourage further research in this area to advance the field of dialogue summarization. Our dataset will be made publicly available for use by the research community.

arxiv情報

著者 Virgile Rennard,Guokan Shang,Damien Grari,Julie Hunter,Michalis Vazirgiannis
発行日 2023-12-08 05:42:04+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク