Research on Information Extraction of LCSTS Dataset Based on an Improved BERTSum-LSTM Model

要約

人工知能の発展に伴い、自然言語処理技術はさまざまな分野で広く活用されるようになりました。
同時に、中国ニュースの要約を作成するには多くの課題があります。
まず、中国のニュースの意味は複雑で、情報量が膨大です。
中国のニュースから重要な情報を抽出することは大きな課題です。
第二に、ニュースの概要は、主要な内容に焦点を当て、重複を避け、簡潔かつ明確にする必要があります。
さらに、多義性や単語の分割などの中国語の特殊性により、中国語ニュースの要約を作成することが困難になります。
上記に基づいて、本論文では、改良されたBERTSum-LSTMモデルに基づくLCSTSデータセットの情報抽出方法を研究する。
BERTSum-LSTM モデルを改良して、中国ニュースの概要を生成する際のパフォーマンスを向上させました。
実験結果は,提案手法がニュース要約の作成に良好な効果をもたらすことを示しており,これはニュース要約の構築にとって非常に重要である。

要約(オリジナル)

With the continuous advancement of artificial intelligence, natural language processing technology has become widely utilized in various fields. At the same time, there are many challenges in creating Chinese news summaries. First of all, the semantics of Chinese news is complex, and the amount of information is enormous. Extracting critical information from Chinese news presents a significant challenge. Second, the news summary should be concise and clear, focusing on the main content and avoiding redundancy. In addition, the particularity of the Chinese language, such as polysemy, word segmentation, etc., makes it challenging to generate Chinese news summaries. Based on the above, this paper studies the information extraction method of the LCSTS dataset based on an improved BERTSum-LSTM model. We improve the BERTSum-LSTM model to make it perform better in generating Chinese news summaries. The experimental results show that the proposed method has a good effect on creating news summaries, which is of great importance to the construction of news summaries.

arxiv情報

著者 Yiming Chen,Haobin Chen,Simin Liu,Yunyun Liu,Fanhao Zhou,Bing Wei
発行日 2024-06-26 14:04:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク