A Cross-Linguistic Pressure for Uniform Information Density in Word Order

要約

自然言語は標準語順と語順の柔軟性の両方において大きく異なりますが、その語順は依然として共通の言語間統計パターンに従い、機能的圧力に起因することがよくあります。
これらの圧力を特定する取り組みにおいて、これまでの研究では、実際の語順と反事実的な語順が比較されてきました。
しかし、そのような調査では、機能上の圧力の 1 つが見落とされています。それは、情報が発話全体に均等に分散されるべきであるという均一情報密度 (UID) 仮説です。
ここで、UIDに対する圧力が言語を超えた語順パターンに影響を与えた可能性があるかどうかを尋ねます。
この目的を達成するために、私たちは計算モデルを使用して、実際の注文が反事実的な注文よりも情報の均一性を高めるかどうかをテストします。
類型的に多様な 10 の言語を対象とした実証的研究では、(i) SVO 言語の中で、実際の語順は常に逆語順よりも均一性が高く、(ii) 言語学的に信じがたい反事実的な語順だけが常に実際の語順の均一性を超えていることがわかります。
これらの発見は、自然言語の開発と使用における情報の均一性に対する圧力と一致します。

要約(オリジナル)

While natural languages differ widely in both canonical word order and word order flexibility, their word orders still follow shared cross-linguistic statistical patterns, often attributed to functional pressures. In the effort to identify these pressures, prior work has compared real and counterfactual word orders. Yet one functional pressure has been overlooked in such investigations: the uniform information density (UID) hypothesis, which holds that information should be spread evenly throughout an utterance. Here, we ask whether a pressure for UID may have influenced word order patterns cross-linguistically. To this end, we use computational models to test whether real orders lead to greater information uniformity than counterfactual orders. In our empirical study of 10 typologically diverse languages, we find that: (i) among SVO languages, real word orders consistently have greater uniformity than reverse word orders, and (ii) only linguistically implausible counterfactual orders consistently exceed the uniformity of real orders. These findings are compatible with a pressure for information uniformity in the development and usage of natural languages.

arxiv情報

著者 Thomas Hikaru Clark,Clara Meister,Tiago Pimentel,Michael Hahn,Ryan Cotterell,Richard Futrell,Roger Levy
発行日 2023-07-09 17:17:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク