要約
歴史言語学における再構成には本質的に曖昧な性質があるにもかかわらず、ほとんどの学者は原型を提案する際にその不確実性を表明しません。
従来の比較手法の特定の側面を自動化する最近提案されたアプローチの成功が進むにつれて、プロトフォームの形式的表現も改善されました。
この形式化により、不確実性の表現と計算の両方に対処できるようになります。
教師付き音韻再構成の最近の進歩を基礎として、アルゴリズムは、以前に注釈が付けられたデータに基づいて特定の原言語の単語を再構成する方法を学習し、同族セットからの自動単語予測の改良された方法に触発され、次のことを可能にする新しいフレームワークを提示します。
言語再構成における不確実性の表現に使用され、言語データからのファジー再構成を計算するためのワークフローも含まれています。
要約(オリジナル)
Despite the inherently fuzzy nature of reconstructions in historical linguistics, most scholars do not represent their uncertainty when proposing proto-forms. With the increasing success of recently proposed approaches to automating certain aspects of the traditional comparative method, the formal representation of proto-forms has also improved. This formalization makes it possible to address both the representation and the computation of uncertainty. Building on recent advances in supervised phonological reconstruction, during which an algorithm learns how to reconstruct words in a given proto-language relying on previously annotated data, and inspired by improved methods for automated word prediction from cognate sets, we present a new framework that allows for the representation of uncertainty in linguistic reconstruction and also includes a workflow for the computation of fuzzy reconstructions from linguistic data.
arxiv情報
著者 | Johann-Mattis List,Nathan W. Hill,Robert Forkel,Frederic Blum |
発行日 | 2023-10-19 13:27:42+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google