Code-switching in text and speech reveals information-theoretic audience design


コードスイッチングは、話者がある言語 (主言語) と別の言語 (第 2 言語) を切り替えるときに発生し、多言語のコンテキストで広く観察されます。
最近の研究では、コード切り替えが主言語の情報負荷の高い領域と相関していることが多いことが示されていますが、主言語負荷が高いことがコード切り替えポイント (話者駆動コード) での二次言語の生成を比較的容易にするだけなのかどうかは不明です。
この論文では、中国語と英語のバイリンガルのオンライン フォーラムの投稿と中国語と英語の自発的なスピーチのトランスクリプトを使用して、高い第一言語 (中国語) の情報負荷が第二言語 (英語) への切り替えと相関しているという以前の調査結果を再現します。


In this work, we use language modeling to investigate the factors that influence code-switching. Code-switching occurs when a speaker alternates between one language variety (the primary language) and another (the secondary language), and is widely observed in multilingual contexts. Recent work has shown that code-switching is often correlated with areas of high information load in the primary language, but it is unclear whether high primary language load only makes the secondary language relatively easier to produce at code-switching points (speaker-driven code-switching), or whether code-switching is additionally used by speakers to signal the need for greater attention on the part of listeners (audience-driven code-switching). In this paper, we use bilingual Chinese-English online forum posts and transcripts of spontaneous Chinese-English speech to replicate prior findings that high primary language (Chinese) information load is correlated with switches to the secondary language (English). We then demonstrate that the information load of the English productions is even higher than that of meaning equivalent Chinese alternatives, and these are therefore not easier to produce, providing evidence of audience-driven influences in code-switching at the level of the communication channel, not just at the sociolinguistic level, in both writing and speech.


著者 Debasmita Bhattacharya,Marten van Schijndel
発行日 2024-08-08 17:14:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク