Gender, names and other mysteries: Towards the ambiguous for gender-inclusive translation

要約

MT におけるジェンダーに関する研究の大部分は、ソース言語のジェンダー マーカーが出力で解決されることが期待される「明確な」入力に焦点を当てています。
逆に、この論文では、ソース文には明示的な性別マーカーが欠如しているが、文法上の性別が豊富であるため、ターゲット文には性別マーカーが含まれているという広範囲にわたるケースを調査します。
特に人名を含む入力に焦点を当てます。
このような文のペアを調査することで、MT のジェンダーバイアスとその緩和に関する研究に新たな光が当てられます。
MT データにおける名前と性別の共起の多くは、ソース言語の「明確な性別」では解決できず、性別が曖昧な例がトレーニング例の大部分を占める可能性があることがわかりました。
ここから、ジェンダーと翻訳の両方における曖昧さを受け入れる、ジェンダー包括的な翻訳に向けた潜在的なステップについて議論します。

要約(オリジナル)

The vast majority of work on gender in MT focuses on ‘unambiguous’ inputs, where gender markers in the source language are expected to be resolved in the output. Conversely, this paper explores the widespread case where the source sentence lacks explicit gender markers, but the target sentence contains them due to richer grammatical gender. We particularly focus on inputs containing person names. Investigating such sentence pairs casts a new light on research into MT gender bias and its mitigation. We find that many name-gender co-occurrences in MT data are not resolvable with ‘unambiguous gender’ in the source language, and that gender-ambiguous examples can make up a large proportion of training examples. From this, we discuss potential steps toward gender-inclusive translation which accepts the ambiguity in both gender and translation.

arxiv情報

著者 Danielle Saunders,Katrina Olsen
発行日 2023-06-07 16:21:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク