要約
言語は世界をさまざまな方法で記述することが知られています。
辞書全体に多様性が浸透しており、語彙のギャップや翻訳不能などの現象を通じて現れます。
しかし、多言語語彙データベースなどの計算リソースでは、多様性はほとんど表現されません。
この論文では、言語の多様性に関連する内容を含む計算語彙を強化する方法を紹介します。
この方法は、言語や文化によって多様であることが知られている親族用語に関する 2 つの大規模なケーススタディを通じて検証されます。1 つのケーススタディは 7 つのアラビア語方言を扱い、もう 1 つはインドネシアの 3 つの言語を扱います。
私たちの結果は、閲覧可能でダウンロード可能な計算リソースとして利用可能であり、親族用語に関するこれまでの言語学研究を拡張し、言語的および文化的に近いコミュニティ内でも多様性の程度についての洞察を提供します。
要約(オリジナル)
Languages are known to describe the world in diverse ways. Across lexicons, diversity is pervasive, appearing through phenomena such as lexical gaps and untranslatability. However, in computational resources, such as multilingual lexical databases, diversity is hardly ever represented. In this paper, we introduce a method to enrich computational lexicons with content relating to linguistic diversity. The method is verified through two large-scale case studies on kinship terminology, a domain known to be diverse across languages and cultures: one case study deals with seven Arabic dialects, while the other one with three Indonesian languages. Our results, made available as browseable and downloadable computational resources, extend prior linguistics research on kinship terminology, and provide insight into the extent of diversity even within linguistically and culturally close communities.
arxiv情報
著者 | Hadi Khalilia,Gábor Bella,Abed Alhakim Freihat,Shandy Darma,Fausto Giunchiglia |
発行日 | 2023-08-24 19:49:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google