Linguistic Analysis using Paninian System of Sounds and Finite State Machines

要約

音声言語の研究は、音韻論、形態論、文法から構成されます。
言語の分析は、その構文、意味論、および語用論に基づいて行うことができます。
言語は、ルート言語、屈折言語、およびステム言語に分類できます。
これらすべての要因により、共通性や類似性だけでなく、言語間で明確かつ微妙な違いを持つ語彙が形成されます。
この論文では、パニニアン音体系を利用して音声マップを構築し、単語を音声マップ上の状態遷移として表現します。
言語を横断する関連単語の各グループは、m 言語 (形態学的言語) によって表されます。
形態学的有限オートマトン (MFA) は、特定の M 言語に属する単語を受け入れるように定義されます。
この演習により、言語に依存しない方法と言語を認識する方法の両方で、話し言葉の単語間の相互関係をより深く理解できるようになります。
私たちの研究と分析に基づいて、私たちは広く受け入れられている家系図モデルの代わりに、サンスクリット語を中心とした言語発達のためのエコシステムモデルを提案します。

要約(オリジナル)

The study of spoken languages comprises phonology, morphology, and grammar. Analysis of a language can be based on its syntax, semantics, and pragmatics. The languages can be classified as root languages, inflectional languages, and stem languages. All these factors lead to the formation of vocabulary which has commonality/similarity as well as distinct and subtle differences across languages. In this paper, we make use of Paninian system of sounds to construct a phonetic map and then words are represented as state transitions on the phonetic map. Each group of related words that cut across languages is represented by a m-language (morphological language). Morphological Finite Automata (MFA) are defined that accept the words belonging to a given m-language. This exercise can enable us to better understand the inter-relationships between words in spoken languages in both language-agnostic and language-cognizant manner. Based on our study and analysis, we propose an Ecosystem Model for Linguistic Development with Sanskrit at the core, in place of the widely accepted family tree model.

arxiv情報

著者 Shreekanth M Prabhu,Abhisek Midye
発行日 2024-04-16 14:19:58+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.FL パーマリンク