mGeNTE: A Multilingual Resource for Gender-Neutral Language and Translation

要約

ジェンダー中立的な言語は、ある性別が他の性別よりも標準であるという暗示を回避することで、より包括的な方向への社会的および言語的変化を反映しています。
これは、性別が特定されていないか無関係である場合でも、人間の指示対象の用語の性別を大幅にエンコードし、男性形に過度に依存する文法的な性別言語に特に関係します。
言語テクノロジーはこうした不平等を反映しており、広範な性差形態を持つ言語に翻訳する際に男性の偏見の影響を受け、固定観念的な連想を永続させることが知られています。
このような場合、ジェンダー中立的な言葉遣いは、不当な二元論的な仮定を避けるのに役立ちます。
しかし、より公平な多言語およびクロスリンガル技術を開発する上での重要性にもかかわらず、包括的な言語研究は依然として不足しており、現在のリソースでは十分にサポートされていません。
このギャップに対処するために、多言語 mGenTe データセットを紹介します。
バイリンガル GeNTE (Piergentili et al., 2023) から派生した mGeNTE は、英語、イタリア語、ドイツ語、スペイン語の言語ペアを含むように元のコーパスを拡張しています。
各言語ペアはターゲット言語の性別および中立的な文と英語に合わせて調整されているため、mGeNTE を使用すると、自動ジェンダー中立翻訳 (GNT) と 3 つの文法的性別言語の言語モデリングの両方の研究が可能になります。

要約(オリジナル)

Gender-neutral language reflects societal and linguistic shifts towards greater inclusivity by avoiding the implication that one gender is the norm over others. This is particularly relevant for grammatical gender languages, which heavily encode the gender of terms for human referents and over-relies on masculine forms, even when gender is unspecified or irrelevant. Language technologies are known to mirror these inequalities, being affected by a male bias and perpetuating stereotypical associations when translating into languages with extensive gendered morphology. In such cases, gender-neutral language can help avoid undue binary assumptions. However, despite its importance for creating fairer multi- and cross-lingual technologies, inclusive language research remains scarce and insufficiently supported in current resources. To address this gap, we present the multilingual mGeNTe dataset. Derived from the bilingual GeNTE (Piergentili et al., 2023), mGeNTE extends the original corpus to include the English-Italian/German/Spanish language pairs. Since each language pair is English-aligned with gendered and neutral sentences in the target languages, mGeNTE enables research in both automatic Gender-Neutral Translation (GNT) and language modelling for three grammatical gender languages.

arxiv情報

著者 Beatrice Savoldi,Eleonora Cupin,Manjinder Thind,Anne Lauscher,Luisa Bentivogli
発行日 2025-01-16 09:35:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク