Swap distance minimization beyond entropy minimization in word order variation

要約

ここでは、$n$ 要素、たとえば主語、直接目的語、動詞 ($n=3$) または主語、直接目的語、間接目的語、動詞 ($n) によって形成される言語構造のすべての可能な順序の問題を考えます。
=4ドル)。
$n!$ の可能な注文の頻度が 2 つの原則によって制約されるかどうかを調査します。
まず、エントロピーの最小化です。これは、組織のさまざまなレベルで自然なコミュニケーション システムを形成するために提案されている原則です。
第 2 に、スワップ距離の最小化、つまり、ソース順序から生成される隣接する要素のスワップが少なくて済む語順の優先順位です。
ここでは、スワップ距離の最小化に関する研究のための新しいスコアである平均スワップ距離を提示し、任意の $n$ に対するそのスコアの理論的分布を調査します。そのスコアの最小値と最大値、サイコロ振り実験での期待値、または語順の頻度がどのような場合であるかを調べます。
シャッフルされます。
$n=3$ または $n=4$ の異なる言語構造において、対応する最小化原理と一致して、エントロピーと平均スワップ距離が著しく小さいかどうかを調べます。
ダイスローリング実験に関して、エントロピー最小化とスワップ距離最小化の強力な証拠が見つかりました。
ポリア壺プロセスに関するこれら 2 つの力の証拠は、$n=4$ では強いですが、$n=3$ では弱いです。
語順頻度をシャッフルしたときにスワップ距離が最小化される証拠が依然として見つかり、スワップ距離の最小化効果が語順エントロピーを最小化するという圧力を超えていることが示されています。

要約(オリジナル)

Here we consider the problem of all the possible orders of a linguistic structure formed by $n$ elements, for instance, subject, direct object and verb ($n=3$) or subject, direct object, indirect object and verb ($n=4$). We investigate if the frequency of the $n!$ possible orders is constrained by two principles. First, entropy minimization, a principle that has been suggested to shape natural communication systems at distinct levels of organization. Second, swap distance minimization, namely a preference for word orders that require fewer swaps of adjacent elements to be produced from a source order. Here we present average swap distance, a novel score for research on swap distance minimization, and investigate the theoretical distribution of that score for any $n$: its minimum and maximum values and its expected value in die rolling experiments or when the word order frequencies are shuffled. We investigate whether entropy and average swap distance are significantly small in distinct linguistic structures with $n=3$ or $n=4$ in agreement with the corresponding minimization principles. We find strong evidence of entropy minimization and swap distance minimization with respect to a die rolling experiment. The evidence of these two forces with respect to a Polya urn process is strong for $n=4$ but weaker for $n=3$. We still find evidence of swap distance minimization when word order frequencies are shuffled, indicating that swap distance minimization effects are beyond pressure to minimize word order entropy.

arxiv情報

著者 Víctor Franco-Sánchez,Arnau Martí-Llobet,Ramon Ferrer-i-Cancho
発行日 2024-04-22 14:01:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, physics.soc-ph パーマリンク