要約
本論文は、初期スラブ語の分詞構文とその有限競合構文($jegda$-‘when’-句)の機能を、コーパスに基づき、定量的、類型的に分析したものである。第1部では、形態統語レベル、係り受けレベル、情報構造レベル、語彙レベルでの初期スラブ語コーパスの詳細な言語アノテーションを活用し、分詞構文とその主要な有限競合詞のさまざまな潜在的機能の間接的証拠を得るとともに、コーパスにおける分詞構文と$jegda$句の分布の説明として、構文性と既定の談話推論の役割を理解する。第2部では、超並列データを用いて、英語の$when$の意味空間を表現する言語の類型的変異を分析し、その範囲は初期スラブ語の分詞構文と$jegda$句を包含する。確率的意味マップを作成し、統計的手法(Kriging、Gaussian Mixture Modelling、precision、recall分析を含む)を用いて、並列コーパスから言語横断的に顕著な次元を導き出し、仮説的概念WHENの意味空間における概念の変化を研究している。
要約(オリジナル)
This thesis is a corpus-based, quantitative, and typological analysis of the functions of Early Slavic participle constructions and their finite competitors ($jegda$-‘when’-clauses). The first part leverages detailed linguistic annotation on Early Slavic corpora at the morphosyntactic, dependency, information-structural, and lexical levels to obtain indirect evidence for different potential functions of participle clauses and their main finite competitor and understand the roles of compositionality and default discourse reasoning as explanations for the distribution of participle constructions and $jegda$-clauses in the corpus. The second part uses massively parallel data to analyze typological variation in how languages express the semantic space of English $when$, whose scope encompasses that of Early Slavic participle constructions and $jegda$-clauses. Probabilistic semantic maps are generated and statistical methods (including Kriging, Gaussian Mixture Modelling, precision and recall analysis) are used to induce cross-linguistically salient dimensions from the parallel corpus and to study conceptual variation within the semantic space of the hypothetical concept WHEN.
arxiv情報
著者 | Nilo Pedrazzini |
発行日 | 2024-05-03 09:54:10+00:00 |
arxivサイト | arxiv_id(pdf) |