Patterns of Persistence and Diffusibility across the World’s Languages

要約

言語の類似性は、遺伝的関連性、地域的接触、普遍性、または偶然によって引き起こされる可能性があります。
併置化、つまり単一の語彙形式を使用して複数の意味を伝える一種の類似性は、十分に研究されていません。
私たちの研究では、系譜上の安定性(持続性)と接触による変化(拡散性)を調査することにより、共融合と音韻における言語間の類似性の言語学的原因を解明しました。
1,966 言語の意味論、系譜論、音韻論、地理データを組み込んだ大規模なグラフを構築します。
次に、言語学の以前の研究で確立されたいくつかの仮説を調査し、新しい仮説を提案することによって、このリソースの可能性を示します。
私たちの結果は、言語学文献で以前に確立された仮説を強く支持する一方で、別の仮説には矛盾する証拠を提供します。
私たちの大規模なリソースは、多言語 NLP や比較言語学など、分野を超えたさらなる研究に活用できます。

要約(オリジナル)

Language similarities can be caused by genetic relatedness, areal contact, universality, or chance. Colexification, i.e. a type of similarity where a single lexical form is used to convey multiple meanings, is underexplored. In our work, we shed light on the linguistic causes of cross-lingual similarity in colexification and phonology, by exploring genealogical stability (persistence) and contact-induced change (diffusibility). We construct large-scale graphs incorporating semantic, genealogical, phonological and geographical data for 1,966 languages. We then show the potential of this resource, by investigating several established hypotheses from previous work in linguistics, while proposing new ones. Our results strongly support a previously established hypothesis in the linguistic literature, while offering contradicting evidence to another. Our large scale resource opens for further research across disciplines, e.g.~in multilingual NLP and comparative linguistics.

arxiv情報

著者 Yiyi Chen,Johannes Bjerva
発行日 2024-01-05 15:33:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク