That’s Optional: A Contemporary Exploration of ‘that’ Omission in English Subordinate Clauses

要約

均一情報密度 (UID) 仮説は、話者は情報のスパイクを回避することで発話のコミュニケーション特性を最適化し、それによって時間の経過とともに比較的均一な情報プロファイルを維持すると仮定します。
この論文では、構文削減に対する UID 原則の影響を調査し、特に英語の従属節における接続詞 ‘that’ のオプションの省略に焦点を当てます。
以前の研究に基づいて、私たちは調査をより大きな英語書き言葉コーパスに拡張し、現代の大規模言語モデル (LLM) を利用し、エントロピーの概念によって情報均一性の原則を拡張して、構文削減の選択肢のユースケースにおける UID の発現を推定します。

要約(オリジナル)

The Uniform Information Density (UID) hypothesis posits that speakers optimize the communicative properties of their utterances by avoiding spikes in information, thereby maintaining a relatively uniform information profile over time. This paper investigates the impact of UID principles on syntactic reduction, specifically focusing on the optional omission of the connector ‘that’ in English subordinate clauses. Building upon previous research, we extend our investigation to a larger corpus of written English, utilize contemporary large language models (LLMs) and extend the information-uniformity principles by the notion of entropy, to estimate the UID manifestations in the usecase of syntactic reduction choices.

arxiv情報

著者 Ella Rabinovich
発行日 2024-05-31 14:23:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク