要約
スタイルは、自然言語生成における今日の課題において重要な概念です。
画像スタイルの転送の分野で成功した後、テキスト スタイルの転送というタスクが現実的かつ魅力的なものになりました。
研究者たちは、詩的なテキストの生成においてスタイルを再現するという課題にも興味を持っています。
自然な詩の生成において再現されるスタイルの評価には依然として問題が残っています。
スタイル再現評価に取り組むために、3 つのキャラクターベースの LSTM モデルを使用しました。
3 つのモデルはすべて、有名なロシア語圏の詩人によるテキストのコーパスでトレーニングされました。
サンプルが評価者に示され、このサンプルがどの詩人のスタイルを再現しているかという 4 つの回答オプションが提供されました。
さらに、評価者は、名前を挙げた詩人の作品についてどの程度よく知っているかを尋ねられました。
文学史を学ぶ学生が評価者となり、94 件の回答が寄せられました。
評価者が詩人の言葉を暗記できれば、スタイルの定義の精度が高まるようです。
各モデルは少なくとも 0.7 のマクロ平均精度を示しました。
この実験では、詩生成のタスクにおけるスタイルの評価には、素朴な読者ではなく専門家を関与させるほうが良いことが示されましたが、lstm モデルは、限られたトレーニング コーパスでもロシアの詩人のスタイルを再現するのに優れています。
要約(オリジナル)
Style is an important concept in today’s challenges in natural language generating. After the success in the field of image style transfer, the task of text style transfer became actual and attractive. Researchers are also interested in the tasks of style reproducing in generation of the poetic text. Evaluation of style reproducing in natural poetry generation remains a problem. I used 3 character-based LSTM-models to work with style reproducing assessment. All three models were trained on the corpus of texts by famous Russian-speaking poets. Samples were shown to the assessors and 4 answer options were offered, the style of which poet this sample reproduces. In addition, the assessors were asked how well they were familiar with the work of the poet they had named. Students studying history of literature were the assessors, 94 answers were received. It has appeared that accuracy of definition of style increases if the assessor can quote the poet by heart. Each model showed at least 0.7 macro-average accuracy. The experiment showed that it is better to involve a professional rather than a naive reader in the evaluation of style in the tasks of poetry generation, while lstm models are good at reproducing the style of Russian poets even on a limited training corpus.
arxiv情報
| 著者 | Boris Orekhov |
| 発行日 | 2023-06-05 10:55:15+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google