Indigenous Languages Spoken in Argentina: A Survey of NLP and Speech Resources

要約

アルゼンチンには多様でありながらあまり知られていない先住民言語の伝統があります。
これらの言語のほとんどは消滅の危険にさらされており、その結果、世界遺産や文化的知識が大幅に失われます。
現在、これらの言語の話者と計算ツールに関する統一情報はありません。
この研究では、アルゼンチンで話されている先住民族の言語の体系化と、アルゼンチンの先住民族に関する全国的な人口統計データを紹介します。
言語は、マプチェ語、トゥプイ・グアラン語、グアイクル語、ケチュア語、マタコ・マタグアヤ語、アイマラ語、チョン語の 7 つの言語族に分類されます。
また、アルゼンチン言語向けに特別に開発されたかどうかにかかわらず、これらの言語で利用可能な計算リソースに関する導入調査も提供します。

要約(オリジナル)

Argentina has a diverse, yet little-known, Indigenous language heritage. Most of these languages are at risk of disappearing, resulting in a significant loss of world heritage and cultural knowledge. Currently, no unified information on speakers and computational tools is available for these languages. In this work, we present a systematization of the Indigenous languages spoken in Argentina, along with national demographic data on the country’s Indigenous population. The languages are classified into seven families: Mapuche, Tup\’i-Guaran\’i, Guaycur\’u, Quechua, Mataco-Mataguaya, Aymara, and Chon. We also provide an introductory survey of the computational resources available for these languages, whether or not they are specifically developed for Argentine varieties.

arxiv情報

著者 Belu Ticona,Fernando Carranza,Viviana Cotik
発行日 2025-01-17 03:47:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク