Are Sounds Sound for Phylogenetic Reconstruction?

要約

言語進化に関する伝統的な研究では、学者は言語家系図の系統推論における健全な法則と健全な対応の重要性をしばしば強調します。
しかし、現在まで、計算によるアプローチでは通常、この可能性が考慮されていません。
ほとんどの計算研究は、言語学における系統再構築のための主要なデータソースとして依然として語彙同族体に依存していますが、音声シーケンスのレベルで単語を比較する利点を著者が賞賛している研究もいくつか存在します。
(a) 異なる言語族からの 10 個の多様なデータセット、および (b) 自動化された同族語と音声の対応検出のための最先端の方法に基づいて、私たちは初めて、音声ベースと同族語のパフォーマンスをテストします。
系統発生的再構築へのベースのアプローチ。
我々の結果は、語彙同族から再構成された系統発生は、音の対応関係から再構成された系統発生よりも、ゴールドスタンダード系統発生に、平均して一般化カルテット距離に関して約 3 分の 1 だけ位相的に近いことを示しています。

要約(オリジナル)

In traditional studies on language evolution, scholars often emphasize the importance of sound laws and sound correspondences for phylogenetic inference of language family trees. However, to date, computational approaches have typically not taken this potential into account. Most computational studies still rely on lexical cognates as major data source for phylogenetic reconstruction in linguistics, although there do exist a few studies in which authors praise the benefits of comparing words at the level of sound sequences. Building on (a) ten diverse datasets from different language families, and (b) state-of-the-art methods for automated cognate and sound correspondence detection, we test, for the first time, the performance of sound-based versus cognate-based approaches to phylogenetic reconstruction. Our results show that phylogenies reconstructed from lexical cognates are topologically closer, by approximately one third with respect to the generalized quartet distance on average, to the gold standard phylogenies than phylogenies reconstructed from sound correspondences.

arxiv情報

著者 Luise Häuser,Gerhard Jäger,Taraka Rama,Johann-Mattis List,Alexandros Stamatakis
発行日 2024-05-14 07:38:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.SD, eess.AS パーマリンク