The Distribution of Dependency Distance and Hierarchical Distance in Contemporary Written Japanese and Its Influencing Factors

要約

日本語の依存関係距離(DD)と階層距離(HD)の関係を調査するために、文の長さを固定するDDとHDの確率分布を比較し、平均依存性距離(MDD)と平均階層距離(MHD)の変化を分析しました。
述語の原子価は、日本語のMDDとMHDのトレードオフ関係の背後にある根本的な要因であることがわかりました。
日本のネイティブスピーカーは、述語の原子価とMDDとMHDの相対サイズを通じて線形の複雑さと階層的な複雑さを調節します。
認知負荷とは別に、述語の原子価はDDとHDの確率分布にも影響します。
HDの分布に対する述語の原子価の効果は、DDのそれよりも大きく、確率分布の違いにつながり、MDDの平均がMHDの平均よりも低くなります。

要約(オリジナル)

To explore the relationship between dependency distance (DD) and hierarchical distance (HD) in Japanese, we compared the probability distributions of DD and HD with and without sentence length fixed, and analyzed the changes in mean dependency distance (MDD) and mean hierarchical distance (MHD) as sentence length increases, along with their correlation coefficient based on the Balanced Corpus of Contemporary Written Japanese. It was found that the valency of the predicates is the underlying factor behind the trade-off relation between MDD and MHD in Japanese. Native speakers of Japanese regulate the linear complexity and hierarchical complexity through the valency of the predicates, and the relative sizes of MDD and MHD depend on whether the threshold of valency has been reached. Apart from the cognitive load, the valency of the predicates also affects the probability distributions of DD and HD. The effect of the valency of the predicates on the distribution of HD is greater than on that of DD, which leads to differences in their probability distributions and causes the mean of MDD to be lower than that of MHD.

arxiv情報

著者 Linxuan Wang,Shuiyuan Yu
発行日 2025-04-30 08:27:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク