要約
イタリアは、ヨーロッパでも類を見ない言語多様性を特徴としており、地元の知識、文化的伝統、芸術的表現、話者の歴史が暗黙のうちにコード化されています。
しかし、イタリアのほとんどの地元の言語と方言は、数世代以内に消滅する危険にさらされています。
NLP コミュニティは最近、イタリア言語を含む絶滅危惧言語に取り組み始めました。
しかし、ほとんどの取り組みでは、これらの言語は、確立された記述形式と均一な機能とニーズを備えた、リソースが不足している言語の一枚岩であり、したがって相互に、または高リソースの標準化された言語と高度に互換性があると想定されています。
この論文では、イタリアの言語的文脈を紹介し、イタリアの言語品種に対する NLP のデフォルトの機械中心の仮定に異議を唱えます。
私たちは、機械中心の NLP から話者中心の NLP へのパラダイムのシフトを提唱し、技術の進歩よりも言語とその話者を優先する取り組みの推奨事項と機会を提供します。
このプロセスを促進するために、私たちは最後に、イタリアの言語と方言の活力をサポートすることを目的とした、責任ある参加型の取り組みに向けた地域コミュニティの構築を提案します。
要約(オリジナル)
Italy is characterized by a one-of-a-kind linguistic diversity landscape in Europe, which implicitly encodes local knowledge, cultural traditions, artistic expressions and history of its speakers. However, most local languages and dialects in Italy are at risk of disappearing within few generations. The NLP community has recently begun to engage with endangered languages, including those of Italy. Yet, most efforts assume that these varieties are under-resourced language monoliths with an established written form and homogeneous functions and needs, and thus highly interchangeable with each other and with high-resource, standardized languages. In this paper, we introduce the linguistic context of Italy and challenge the default machine-centric assumptions of NLP for Italy’s language varieties. We advocate for a shift in the paradigm from machine-centric to speaker-centric NLP, and provide recommendations and opportunities for work that prioritizes languages and their speakers over technological advances. To facilitate the process, we finally propose building a local community towards responsible, participatory efforts aimed at supporting vitality of languages and dialects of Italy.
arxiv情報
著者 | Alan Ramponi |
発行日 | 2023-11-20 16:54:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google