Understanding Literary Texts by LLMs: A Case Study of Ancient Chinese Poetry

要約

大規模言語モデル (LLM) の誕生と急速な発展は、文学の分野に大きな波紋を引き起こしました。
かつては達成不可能と考えられていましたが、文学創作における AI の役割はますます現実のものになりつつあります。
詩、ジョーク、短編小説などのジャンルでは、新鮮な新しい視点を提供する多数の AI ツールが登場しています。
しかし、これらの作品の品質をさらに向上させることは困難です。
これは主に、優れた文学作品を理解して鑑賞するには、文学理論の知識、美的感性、学際的な知識など、かなりの敷居が必要だからです。
したがって、この分野に関する信頼できるデータは非常に不足しています。
さらに、文学作品の評価は複雑であることが多く、完全に定量化することが困難であるため、AI 創作のさらなる発展が直接妨げられます。
この問題に対処するために、この論文では、古代中国の詩を実験例として使用し、LLM の観点から文学テキストの謎を探求することを試みます。
まず、さまざまな情報源からさまざまな古代の詩を収集し、その一部に専門家に注釈を付けてもらいました。
次に、LLM に基づいて、これらすべての詩を評価するためのさまざまな理解指標を設計しました。
最後に、文学的パターンを特定するために、さまざまな詩集間の相関関係と相違点を分析しました。
私たちの実験を通じて、LLM に基づく高レベルの文学創作​​の将来の発展に技術的サポートを提供する一連の啓発的な現象を観察しました。

要約(オリジナル)

The birth and rapid development of large language models (LLMs) have caused quite a stir in the field of literature. Once considered unattainable, AI’s role in literary creation is increasingly becoming a reality. In genres such as poetry, jokes, and short stories, numerous AI tools have emerged, offering refreshing new perspectives. However, it’s difficult to further improve the quality of these works. This is primarily because understanding and appreciating a good literary work involves a considerable threshold, such as knowledge of literary theory, aesthetic sensibility, interdisciplinary knowledge. Therefore, authoritative data in this area is quite lacking. Additionally, evaluating literary works is often complex and hard to fully quantify, which directly hinders the further development of AI creation. To address this issue, this paper attempts to explore the mysteries of literary texts from the perspective of LLMs, using ancient Chinese poetry as an example for experimentation. First, we collected a variety of ancient poems from different sources and had experts annotate a small portion of them. Then, we designed a range of comprehension metrics based on LLMs to evaluate all these poems. Finally, we analyzed the correlations and differences between various poem collections to identify literary patterns. Through our experiments, we observed a series of enlightening phenomena that provide technical support for the future development of high-level literary creation based on LLMs.

arxiv情報

著者 Cheng Zhao,Bin Wang,Zhen Wang
発行日 2024-09-11 07:51:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク