Overview of the VLSP 2022 — Abmusu Shared Task: A Data Challenge for Vietnamese Abstractive Multi-document Summarization


このペーパーでは、VLSP 2022 – ベトナム語抽象化マルチドキュメント要約 (Abmusu) ベトナム ニュースの共有タスクの概要を報告します。
このタスクは、ベトナム語言語と音声処理に関する 9$^{th}$ 年次ワークショップ (VLSP 2022) で主催されます。
Abmusu 共有タスクの目標は、トピックに関する一連の文書の抽象的な要約を自動的に作成できる要約システムを開発することです。
Abmusu 共有タスクの範囲では、ベトナム ニュースの要約のみに焦点を当て、8 カテゴリのベトナム ニュースから収集された 600 クラスターの 1,839 ドキュメントからなる人間による注釈付きデータセットを構築します。
参加モデルは、文書要約問題の最も一般的な評価指標である \texttt{ROUGE2-F1} スコアに基づいて評価され、ランク付けされます。


This paper reports the overview of the VLSP 2022 – Vietnamese abstractive multi-document summarization (Abmusu) shared task for Vietnamese News. This task is hosted at the 9$^{th}$ annual workshop on Vietnamese Language and Speech Processing (VLSP 2022). The goal of Abmusu shared task is to develop summarization systems that could create abstractive summaries automatically for a set of documents on a topic. The model input is multiple news documents on the same topic, and the corresponding output is a related abstractive summary. In the scope of Abmusu shared task, we only focus on Vietnamese news summarization and build a human-annotated dataset of 1,839 documents in 600 clusters, collected from Vietnamese news in 8 categories. Participated models are evaluated and ranked in terms of \texttt{ROUGE2-F1} score, the most typical evaluation metric for document summarization problem.


著者 Mai-Vu Tran,Hoang-Quynh Le,Duy-Cat Can,Quoc-An Nguyen
発行日 2023-11-27 04:01:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク