From ‘Showgirls’ to ‘Performers’: Fine-tuning with Gender-inclusive Language for Bias Reduction in LLMs

要約

ジェンダーバイアスは、大規模言語モデル(LLM)とそのトレーニングデータに蔓延しているだけでなく、言語そのものの構造的側面にもしっかりと根付いている。そのため、LLMのトレーニングデータ内の言語構造を適応させることで、モデル内のジェンダー表現をより包括的なものにすることができる。私たちの研究の焦点は、「show-girl」や「man-cave」のような英語のジェンダー排他的接辞である。我々はLLMトレーニングデータセットを用いて、692のジェンダー排他的な用語とジェンダー中立的な変化形のカタログを作成し、そこからジェンダーを含む微調整データセットである「Tiny Heap」を開発する。このデータセットを用いて3つの異なるLLMをファインチューニングしたところ、モデル全体にわたってジェンダー・ステレオタイピングの傾向が全体的に減少することが観測された。我々のアプローチは、LLM訓練データにおけるジェンダー包摂性を高めるための実用的な方法を提供し、NLPにおけるバイアス緩和研究にクィアフェミニスト言語活動主義を取り入れることに貢献する。

要約(オリジナル)

Gender bias is not only prevalent in Large Language Models (LLMs) and their training data, but also firmly ingrained into the structural aspects of language itself. Therefore, adapting linguistic structures within LLM training data to promote gender-inclusivity can make gender representations within the model more inclusive. The focus of our work are gender-exclusive affixes in English, such as in ‘show-girl’ or ‘man-cave’, which can perpetuate gender stereotypes and binary conceptions of gender. We use an LLM training dataset to compile a catalogue of 692 gender-exclusive terms along with gender-neutral variants and from this, develop a gender-inclusive fine-tuning dataset, the ‘Tiny Heap’. Fine-tuning three different LLMs with this dataset, we observe an overall reduction in gender-stereotyping tendencies across the models. Our approach provides a practical method for enhancing gender inclusivity in LLM training data and contributes to incorporating queer-feminist linguistic activism in bias mitigation research in NLP.

arxiv情報

著者 Marion Bartl,Susan Leavy
発行日 2024-07-05 11:31:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク