Enhancing Gender-Inclusive Machine Translation with Neomorphemes and Large Language Models

要約

機械翻訳 (MT) モデルは、特に広範な性差形態を持つ言語に翻訳する場合、性差の影響を受けることが知られています。
したがって、彼らは、非バイナリのアイデンティティを代表する、ジェンダーを包括する言語を使用するという点でまだ不十分です。
この論文では、より公平な MT に向けたアプローチとして、バイナリの性別マーキングを回避する新形態素であるジェンダー包括的な新形態素について考察します。
この方向では、新形態素を使用して英語からイタリア語に翻訳するための大規模言語モデル (LLM) を使用したプロンプト手法を探索します。
これまでのところ、この分野はその新規性と公的に利用可能な評価リソースの欠如により十分に研究されていません。
私たちは、ネオ形態素を使用したジェンダーを含む en-it 翻訳を評価するように設計されたリソース、Neo-GATE をリリースすることでこのギャップを埋めます。
Neo-GATE を使用して、異なるファミリー、サイズ、異なるプロンプト形式の 4 つの LLM を評価し、MT のこの新しいタスクにおけるそれぞれの長所と短所を特定します。

要約(オリジナル)

Machine translation (MT) models are known to suffer from gender bias, especially when translating into languages with extensive gendered morphology. Accordingly, they still fall short in using gender-inclusive language, also representative of non-binary identities. In this paper, we look at gender-inclusive neomorphemes, neologistic elements that avoid binary gender markings as an approach towards fairer MT. In this direction, we explore prompting techniques with large language models (LLMs) to translate from English into Italian using neomorphemes. So far, this area has been under-explored due to its novelty and the lack of publicly available evaluation resources. We fill this gap by releasing Neo-GATE, a resource designed to evaluate gender-inclusive en-it translation with neomorphemes. With Neo-GATE, we assess four LLMs of different families and sizes and different prompt formats, identifying strengths and weaknesses of each on this novel task for MT.

arxiv情報

著者 Andrea Piergentili,Beatrice Savoldi,Matteo Negri,Luisa Bentivogli
発行日 2024-05-14 10:02:50+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク