CNsum:Automatic Summarization for Chinese News Text

要約

大規模なデータから貴重な情報を効率的に取得することは、ビッグデータの時代における研究目標となっています。
テキスト要約技術は、この需要を満たすために継続的に開発されています。
また、最近の研究では、変圧器ベースの事前訓練モデルが自然言語処理(NLP)のさまざまなタスクで大きな成功を収めていることが示されています。
中国のニューステキストの要約生成の問題と中国語へのトランス構造の適用を目指して、このホワイトペーパーでは、変圧器構造に基づいた中国のニューステキスト要約モデル(CNSUM)を提案し、Thucnewsなどの中国のデータセットでテストします。
実施された実験の結果は、CNSUMがモデルのアウトパフォーマンスを検証するベースラインモデルよりも優れたルージュスコアを達成することを示しています。

要約(オリジナル)

Obtaining valuable information from massive data efficiently has become our research goal in the era of Big Data. Text summarization technology has been continuously developed to meet this demand. Recent work has also shown that transformer-based pre-trained language models have achieved great success on various tasks in Natural Language Processing (NLP). Aiming at the problem of Chinese news text summary generation and the application of Transformer structure on Chinese, this paper proposes a Chinese news text summarization model (CNsum) based on Transformer structure, and tests it on Chinese datasets such as THUCNews. The results of the conducted experiments show that CNsum achieves better ROUGE score than the baseline models, which verifies the outperformance of the model.

arxiv情報

著者 Yu Zhao,Songping Huang,Dongsheng Zhou,Zhaoyun Ding,Fei Wang,Aixin Nian
発行日 2025-03-07 14:56:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク