Abstractive Summary Generation for the Urdu Language

要約

抽象的な要約の生成は、モデルがソース テキストを理解し、重要な情報を捉えた簡潔で一貫した要約を生成する必要がある難しいタスクです。
この論文では、ウルドゥー語で抽象的な要約を生成するためのエンコーダー/デコーダー アプローチの使用を検討します。
私たちは、セルフアテンション メカニズムを利用して入力テキストをエンコードし、概要を生成するトランスフォーマー ベースのモデルを採用しています。
私たちの実験は、私たちのモデルが文法的に正しく、意味的に意味のある要約を生成できることを示しています。
私たちは公開されているデータセットでモデルを評価し、Rouge スコアに関して最先端の結果を達成しました。
また、モデルの出力の定性分析を実施して、その有効性と限界を評価します。
私たちの調査結果は、エンコーダー/デコーダーのアプローチがウルドゥー語での抽象的な要約生成の有望な方法であり、適切な修正を加えれば他の言語にも拡張できることを示唆しています。

要約(オリジナル)

Abstractive summary generation is a challenging task that requires the model to comprehend the source text and generate a concise and coherent summary that captures the essential information. In this paper, we explore the use of an encoder/decoder approach for abstractive summary generation in the Urdu language. We employ a transformer-based model that utilizes self-attention mechanisms to encode the input text and generate a summary. Our experiments show that our model can produce summaries that are grammatically correct and semantically meaningful. We evaluate our model on a publicly available dataset and achieve state-of-the-art results in terms of Rouge scores. We also conduct a qualitative analysis of our model’s output to assess its effectiveness and limitations. Our findings suggest that the encoder/decoder approach is a promising method for abstractive summary generation in Urdu and can be extended to other languages with suitable modifications.

arxiv情報

著者 Ali Raza,Hadia Sultan Raja,Usman Maratib
発行日 2023-05-25 15:55:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T50, 91F20 (Secondary), cs.AI, cs.CL, I.2 パーマリンク