要約
この研究は、さまざまな深層学習技術とアルゴリズムを使用して生成されたウルドゥー語の詩を提供します。
データは Rekhta Web サイトを通じて収集され、いくつかの対句を含む 1341 個のテキスト ファイルが含まれています。
詩に関するデータは、特定のジャンルや詩人のものではありませんでした。
代わりに、それはウルドゥー語の詩とガザール語を混合したコレクションでした。
モデルを適用した Long Short-term Memory Networks (LSTM) や Gated Recurrent Unit (GRU) など、さまざまな深層学習技術が使用されています。
自然言語処理 (NLP) は、人間が使用および理解できる言語を理解し、分析し、生成するために機械学習で使用できます。
さまざまな技術を使用して、さまざまな言語の詩を生成するために多くの研究が行われてきました。
データの収集と使用方法も研究者によって異なりました。
このプロジェクトの主な目的は、サンプリング データではなく、データを完全に使用してウルドゥー語の詩を生成するモデルを提供することです。
また、これにより、ベースペーパーのようなローマ字ウルドゥー語ではなく、純粋なウルドゥー語で詩が生成される場合があります。
結果は、モデルによって生成された詩の精度が良好であることを示しました。
要約(オリジナル)
This study provides Urdu poetry generated using different deep-learning techniques and algorithms. The data was collected through the Rekhta website, containing 1341 text files with several couplets. The data on poetry was not from any specific genre or poet. Instead, it was a collection of mixed Urdu poems and Ghazals. Different deep learning techniques, such as the model applied Long Short-term Memory Networks (LSTM) and Gated Recurrent Unit (GRU), have been used. Natural Language Processing (NLP) may be used in machine learning to understand, analyze, and generate a language humans may use and understand. Much work has been done on generating poetry for different languages using different techniques. The collection and use of data were also different for different researchers. The primary purpose of this project is to provide a model that generates Urdu poems by using data completely, not by sampling data. Also, this may generate poems in pure Urdu, not Roman Urdu, as in the base paper. The results have shown good accuracy in the poems generated by the model.
arxiv情報
著者 | Muhammad Shoaib Farooq,Ali Abbas |
発行日 | 2023-09-25 15:44:24+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google