Significance of Chain of Thought in Gender Bias Mitigation for English-Dravidian Machine Translation


機械翻訳(MT)システムにおけるジェンダーバイアスは、正確で包括的な翻訳を実現する上で大きな課題となる。本稿では、ドラヴィダ語族のテルグ語やカンナダ語などの機械翻訳システムにおけるジェンダーバイアスを検証し、Google翻訳とChat- GPTを使用して、ジェンダー屈折が翻訳精度と中立性にどのような影響を与えるかを分析する。その結果、複数形はバイアスを減らすことができるが、個人中心の文章は歴史的なステレオタイプに起因するバイアスを維持することが多いことがわかった。この研究では、Chain of Thought process-ingを評価し、テルグ語では80%から4%に、カンナダ語では40%から0%にバイアスが大幅に軽減されることを指摘している。また、テルグ語とカンナダ語の翻訳を比較し、これらの課題に対処するための言語固有の戦略の必要性を強調するとともに、データ準備と推論中のプロンプトの両方における公平性を高めるための今後の研究の方向性を示唆している。


Gender bias in machine translation (MT) sys- tems poses a significant challenge to achieving accurate and inclusive translations. This paper examines gender bias in machine translation systems for languages such as Telugu and Kan- nada from the Dravidian family, analyzing how gender inflections affect translation accuracy and neutrality using Google Translate and Chat- GPT. It finds that while plural forms can reduce bias, individual-centric sentences often main- tain the bias due to historical stereotypes. The study evaluates the Chain of Thought process- ing, noting significant bias mitigation from 80% to 4% in Telugu and from 40% to 0% in Kan- nada. It also compares Telugu and Kannada translations, emphasizing the need for language specific strategies to address these challenges and suggesting directions for future research to enhance fairness in both data preparation and prompts during inference.


著者 Lavanya Prahallad,Radhika Mamidi
発行日 2024-06-03 15:59:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, DeepL

カテゴリー: cs.AI, cs.CL パーマリンク