The Echoes of Multilinguality: Tracing Cultural Value Shifts during LM Fine-tuning

要約

さまざまな言語で書かれたテキストは、その作者の文化に依存するさまざまな信念を反映しています。
したがって、複数の言語のテキストを連結して共同トレーニングされる多言語 LM (MLM) が、言語ごとに異なる文化的価値観をエンコードすることが期待されます。
しかし、これらの LM の「多言語性」は言語を越えた共有によって促進されているため、文化的価値観が 1 つの言語から別の言語に滲み出ると信じる理由もあります。
これは、複数の言語でテキストを生成することに熟達していることとは別に、コミュニティに役立つ言語テクノロジーを作成するために、LM の出力がその偏見に敏感であることも必要とするため、実際の MLM の使用を制限します (Naous et al., 2023)。
しかし、MLM において文化的価値観がどのように出現し、進化するかについてはほとんど知られていません (Hershcovich et al., 2022a)。
私たちは、微調整中にそのような値がどのように修正されるかを研究することにより、言語がさまざまなテスト言語にエンコードされた文化的価値にどのような影響を与えることができるかを初めて研究しました。
微調整段階に焦点を当てることで、さまざまなデータ ソースや言語からの新しい言語体験にさらされたときの価値の変化間の相互作用を研究することができます。
最後に、トレーニング データの帰属手法を使用して、値の変化を引き起こす傾向のある微調整サンプルのパターンとその元の言語を見つけます。

要約(オリジナル)

Texts written in different languages reflect different culturally-dependent beliefs of their writers. Thus, we expect multilingual LMs (MLMs), that are jointly trained on a concatenation of text in multiple languages, to encode different cultural values for each language. Yet, as the ‘multilinguality’ of these LMs is driven by cross-lingual sharing, we also have reason to belief that cultural values bleed over from one language into another. This limits the use of MLMs in practice, as apart from being proficient in generating text in multiple languages, creating language technology that can serve a community also requires the output of LMs to be sensitive to their biases (Naous et al., 2023). Yet, little is known about how cultural values emerge and evolve in MLMs (Hershcovich et al., 2022a). We are the first to study how languages can exert influence on the cultural values encoded for different test languages, by studying how such values are revised during fine-tuning. Focusing on the fine-tuning stage allows us to study the interplay between value shifts when exposed to new linguistic experience from different data sources and languages. Lastly, we use a training data attribution method to find patterns in the fine-tuning examples, and the languages that they come from, that tend to instigate value shifts.

arxiv情報

著者 Rochelle Choenni,Anne Lauscher,Ekaterina Shutova
発行日 2024-05-21 12:55:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク