Automating Sound Change Prediction for Phylogenetic Inference: A Tukanoan Case Study

要約

(1)それぞれの原形と音法則を持つ同族セット、(2)電話から調音特徴へのマッピング、(3)音変化の類型論的データベースが与えられた場合に、言語系統推論を部分的に自動化する一連の新しい手法について述べる。これらの音変化データに対してニューラルネットワークを学習させ、電話間の調音距離に重み付けを行い、歴史的原形と現代の子孫の間の中間的な音変化ステップを予測する。ツカノア語の実験では、専門家のアノテーションを用いた系統樹から、一般化四分音符距離0.12の系統樹を作成することができた。ニューラルアプローチとパーシモンベースの樹木予測の利点と欠点について議論する。また、自動的な音則誘導のための最小限の汎化学習器を実験し、専門家の注釈からの音則に匹敵する効果があることを発見した。我々のコードは https://github.com/cmu-llab/aiscp で公開されている。

要約(オリジナル)

We describe a set of new methods to partially automate linguistic phylogenetic inference given (1) cognate sets with their respective protoforms and sound laws, (2) a mapping from phones to their articulatory features and (3) a typological database of sound changes. We train a neural network on these sound change data to weight articulatory distances between phones and predict intermediate sound change steps between historical protoforms and their modern descendants, replacing a linguistic expert in part of a parsimony-based phylogenetic inference algorithm. In our best experiments on Tukanoan languages, this method produces trees with a Generalized Quartet Distance of 0.12 from a tree that used expert annotations, a significant improvement over other semi-automated baselines. We discuss potential benefits and drawbacks to our neural approach and parsimony-based tree prediction. We also experiment with a minimal generalization learner for automatic sound law induction, finding it comparably effective to sound laws from expert annotation. Our code is publicly available at https://github.com/cmu-llab/aiscp.

arxiv情報

著者 Kalvin Chang,Nathaniel R. Robinson,Anna Cai,Ting Chen,Annie Zhang,David R. Mortensen
発行日 2024-02-02 17:20:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク