Unification of Balti and trans-border sister dialects in the essence of LLMs and AI Technology

要約

バルティと呼ばれる言語は、中国・チベット語族、特にチベット・ビルマ語族に属します。
インド、中国、パキスタン、ネパール、チベット、ビルマ、ブータンでは、地域文化の影響を受け、さまざまな方言を生み出し、人口間でバリエーションを持って理解されています。
多様な文化的、社会政治的、宗教的、地理的影響を考慮すると、共通根、語彙、音韻論的観点の基礎である方言の統一を進めることが重要である。
グローバル化の時代とAI技術の開発がますます頻繁になる中、多様性と方言統一の取り組みを理解することは、共通点を理解し、避けられない状況によって影響を受けるギャップを縮めるために重要です。
この記事では、これまでさまざまな方言で行われてきた取り組みに基づいて、大規模言語モデル LLM の本質である人工知能 AI が、絶滅の危機に瀕しているバルティ語の分析、文書化、標準化にどのように役立つかを分析および検証します。

要約(オリジナル)

The language called Balti belongs to the Sino-Tibetan, specifically the Tibeto-Burman language family. It is understood with variations, across populations in India, China, Pakistan, Nepal, Tibet, Burma, and Bhutan, influenced by local cultures and producing various dialects. Considering the diverse cultural, socio-political, religious, and geographical impacts, it is important to step forward unifying the dialects, the basis of common root, lexica, and phonological perspectives, is vital. In the era of globalization and the increasingly frequent developments in AI technology, understanding the diversity and the efforts of dialect unification is important to understanding commonalities and shortening the gaps impacted by unavoidable circumstances. This article analyzes and examines how artificial intelligence AI in the essence of Large Language Models LLMs, can assist in analyzing, documenting, and standardizing the endangered Balti Language, based on the efforts made in different dialects so far.

arxiv情報

著者 Muhammad Sharif,Jiangyan Yi,Muhammad Shoaib
発行日 2024-11-20 15:48:21+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV パーマリンク