Code-switching in text and speech reveals information-theoretic audience design

要約

この研究では、言語モデリングを使用して、コードスイッチングに影響を与える要因を調査します。
コードスイッチングは、話者がある言語 (主言語) と別の言語 (第 2 言語) を切り替えるときに発生し、多言語のコンテキストで広く観察されます。
最近の研究では、コード切り替えが主言語の情報負荷の高い領域と相関していることが多いことが示されていますが、主言語負荷が高いことがコード切り替えポイント (話者駆動コード) での二次言語の生成を比較的容易にするだけなのかどうかは不明です。
-スイッチング)、または聴取者側にさらに注意を払う必要があることを示すために、講演者がコードスイッチングをさらに使用するかどうか(聴衆主導のコードスイッチング)。
この論文では、中国語と英語のバイリンガルのオンライン フォーラムの投稿と中国語と英語の自発的なスピーチのトランスクリプトを使用して、高い第一言語 (中国語) の情報負荷が第二言語 (英語) への切り替えと相関しているという以前の調査結果を再現します。
次に、英語の作品の情報負荷は、同等の意味の中国語の代替作品の情報負荷よりもさらに高く、したがってこれらの作品を制作するのは簡単ではないことを実証し、コミュニケーションチャネルのレベルでのコードスイッチングにおける視聴者主導の影響の証拠を提供します。
社会言語学的レベルだけでなく、執筆とスピーチの両方において。

要約(オリジナル)

In this work, we use language modeling to investigate the factors that influence code-switching. Code-switching occurs when a speaker alternates between one language variety (the primary language) and another (the secondary language), and is widely observed in multilingual contexts. Recent work has shown that code-switching is often correlated with areas of high information load in the primary language, but it is unclear whether high primary language load only makes the secondary language relatively easier to produce at code-switching points (speaker-driven code-switching), or whether code-switching is additionally used by speakers to signal the need for greater attention on the part of listeners (audience-driven code-switching). In this paper, we use bilingual Chinese-English online forum posts and transcripts of spontaneous Chinese-English speech to replicate prior findings that high primary language (Chinese) information load is correlated with switches to the secondary language (English). We then demonstrate that the information load of the English productions is even higher than that of meaning equivalent Chinese alternatives, and these are therefore not easier to produce, providing evidence of audience-driven influences in code-switching at the level of the communication channel, not just at the sociolinguistic level, in both writing and speech.

arxiv情報

著者 Debasmita Bhattacharya,Marten van Schijndel
発行日 2024-08-08 17:14:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク