Patterns of Persistence and Diffusibility across World’s Languages

要約

言語の類似性は、遺伝的近縁性、地域的接触、普遍性、または偶然によって引き起こされる可能性がある。共起語化、すなわち、単一の語彙形式が複数の意味を伝えるために使われる類似性の一種は、あまり研究されていない。本研究では、系譜的な安定性(持続性)と接触による変化(拡散性)を探ることで、共起語化と音韻論における言語横断的類似性の言語学的原因を明らかにする。1,966言語について、意味、系譜、音韻、地理的データを組み込んだ大規模なグラフを構築する。そして、言語学の先行研究から確立されたいくつかの仮説を調査し、新しい仮説を提案することで、このリソースの可能性を示す。我々の結果は、言語学の文献で既に確立された仮説を強く支持する一方、別の仮説に対しては矛盾する証拠を提示した。この大規模なリソースは、多言語NLPや比較言語学など、分野を超えたさらなる研究の可能性を開くものである。

要約(オリジナル)

Language similarities can be caused by genetic relatedness, areal contact, universality, or chance. Colexification, i.e.~a type of similarity where a single lexical form is used to convey multiple meanings, is underexplored. In our work, we shed light on the linguistic causes of cross-lingual similarity in colexification and phonology, by exploring genealogical stability (persistence) and contact-induced change (diffusibility). We construct large-scale graphs incorporating semantic, genealogical, phonological and geographical data for 1,966 languages. We then show the potential of this resource, by investigating several established hypotheses from previous work in linguistics, while proposing new ones. Our results strongly support a previously established hypothesis in the linguistic literature, while offering contradicting evidence to another. Our large scale resource opens for further research across disciplines, e.g.~in multilingual NLP and comparative linguistics.

arxiv情報

著者 Yiyi Chen,Johannes Bjerva
発行日 2024-01-03 12:05:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク