要約
すべての詩的な形式はどこかから来ます。
韻律テンプレートは、何世代にもわたってコピーされたり、個人によって変更されたり、外国の伝統から輸入されたり、言語進化の圧力によって根本的に変更されたりする可能性があります。
しかし、これらの関係を言語や時代を超えて追跡するのは難しいことで知られています。
この論文では、ローカルシーケンスアラインメントを使用して詩の構造的類似性を検出するための教師なし方法を紹介します。
この方法は、詩的なテキストを 4 文字のアルファベットを使用した韻律特徴の文字列としてエンコードすることに依存しています。
次に、これらのシーケンスが整列されて、重み付けされたシンボル (不一致) に基づいて距離測定値が導出されます。
ローカルアライメントにより、詩の基礎となる韻律パターンの出現特性に従って詩をクラスター化することができます。
私たちは、強力なベースラインに対して拍子認識タスクのメソッドのパフォーマンスを評価し、3 つの短いケーススタディを使用して、言語を超えた歴史的研究に対するその可能性を示します: 1) 古典ラテン語の量的拍子における突然変異、2) ルネッサンスの 12 音節のヨーロッパへの拡散、3)
) 18 ~ 19 世紀のチェコ、ドイツ、ロシアにおける現代のメーターの配置の比較。
このアルゴリズムの実装を、オープン ライセンスの Python パッケージとしてリリースします。
要約(オリジナル)
All poetic forms come from somewhere. Prosodic templates can be copied for generations, altered by individuals, imported from foreign traditions, or fundamentally changed under the pressures of language evolution. Yet these relationships are notoriously difficult to trace across languages and times. This paper introduces an unsupervised method for detecting structural similarities in poems using local sequence alignment. The method relies on encoding poetic texts as strings of prosodic features using a four-letter alphabet; these sequences are then aligned to derive a distance measure based on weighted symbol (mis)matches. Local alignment allows poems to be clustered according to emergent properties of their underlying prosodic patterns. We evaluate method performance on a meter recognition tasks against strong baselines and show its potential for cross-lingual and historical research using three short case studies: 1) mutations in quantitative meter in classical Latin, 2) European diffusion of the Renaissance hendecasyllable, and 3) comparative alignment of modern meters in 18–19th century Czech, German and Russian. We release an implementation of the algorithm as a Python package with an open license.
arxiv情報
著者 | Ben Nagy,Artjoms Šeļa,Mirella De Sisto,Petr Plecháč |
発行日 | 2024-04-26 11:37:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google