Standard Language Ideology in AI-Generated Language

要約

標準的な言語イデオロギーは、大規模な言語モデル(LLM)によって生成される言語で反映され、強化されています。
私たちは、標準的な言語のイデオロギーがAIに生成された言語でどのように現れるかを示すオープンな問題のファセット分類法を提示し、より広くマイノリティ化された言語コミュニティと社会への影響を示しています。
標準的なAIに生成された言語イデオロギーの概念を紹介します。これは、LLMSが「標準」言語(特に標準的なアメリカ英語(SAE))を言語デフォルトとして位置付け、SAEが最も「適切な」言語であるという認識を強化するためです。
次に、さまざまな英語の品種を模倣しようとする、または拒否する生成的AIツールの利点と欠点だけでなく、望ましいシステムの動作を構成するものに関する継続的な緊張について説明します。
狭い技術的修正を規定するのではなく、構造条件の変化と多様な言語コミュニティのより解放結果をサポートすることに焦点を当てた研究者、実務家、資金提供者に3つの推奨事項を提供します。

要約(オリジナル)

Standard language ideology is reflected and reinforced in language generated by large language models (LLMs). We present a faceted taxonomy of open problems that illustrate how standard language ideology manifests in AI-generated language, alongside implications for minoritized language communities and society more broadly. We introduce the concept of standard AI-generated language ideology, a process through which LLMs position ‘standard’ languages–particularly Standard American English (SAE)–as the linguistic default, reinforcing the perception that SAE is the most ‘appropriate’ language. We then discuss ongoing tensions around what constitutes desirable system behavior, as well as advantages and drawbacks of generative AI tools attempting, or refusing, to imitate different English language varieties. Rather than prescribing narrow technical fixes, we offer three recommendations for researchers, practitioners, and funders that focus on shifting structural conditions and supporting more emancipatory outcomes for diverse language communities.

arxiv情報

著者 Genevieve Smith,Eve Fleisig,Madeline Bossi,Ishita Rustagi,Xavier Yin
発行日 2025-06-11 16:54:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク