要約
KochとOesterreicherの「n \ ‘ahe und distanz」(n \’ ahe =即時性、概念的口頭、distanz =距離、概念的リテラシー)のモデルは、ドイツの言語学で絶えず使用されています。
ただし、コーパス言語分析で使用する統計的基盤はありませんが、経験的言語学にますます移動しています。
理論的には、特に、書かれたテキストは、言語的特徴によって概念的な口頭とリテラシーの規模で評価できることが規定されています。
この記事では、PCAに基づいたこのようなスケールを確立し、自動分析と組み合わせます。
新しいドイツ語の2つのコーパスは例として機能します。
確立された機能を評価する場合、中心的な発見は、テキストを差別化された方法でランク付けするために、概念的口頭とリテラシーの特徴を区別する必要があるということです。
スケールについては、コーパスコンピレーションでの使用を考慮して、およびより大きなコーパスでの分析のガイドとしても説明されています。
理論主導の出発点と「仕立てられた」次元として、Biberの次元1と比較したアプローチは、これらのサポート、制御タスクに特に適しています。
要約(オリジナル)
Koch and Oesterreicher’s model of ‘N\’ahe und Distanz’ (N\’ahe = immediacy, conceptual orality; Distanz = distance, conceptual literacy) is constantly used in German linguistics. However, there is no statistical foundation for use in corpus linguistic analyzes, while it is increasingly moving into empirical corpus linguistics. Theoretically, it is stipulated, among other things, that written texts can be rated on a scale of conceptual orality and literacy by linguistic features. This article establishes such a scale based on PCA and combines it with automatic analysis. Two corpora of New High German serve as examples. When evaluating established features, a central finding is that features of conceptual orality and literacy must be distinguished in order to rank texts in a differentiated manner. The scale is also discussed with a view to its use in corpus compilation and as a guide for analyzes in larger corpora. With a theory-driven starting point and as a ‘tailored’ dimension, the approach compared to Biber’s Dimension 1 is particularly suitable for these supporting, controlling tasks.
arxiv情報
著者 | Volker Emmrich |
発行日 | 2025-02-05 15:08:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google