Model-based Counterfactual Generator for Gender Bias Mitigation


反事実データ拡張 (CDA) は、自然言語モデルにおけるジェンダー バイアスを軽減するための推奨される手法の 1 つです。
CDA 技術では、主に辞書に基づいた単語置換が使用されてきました。
このような辞書ベースの CDA 技術は、ジェンダーバイアスの緩和を大幅に改善することが示されていますが、本稿では、非文法的な構成の影響を受けやすいことや、一般化の欠如など、辞書ベースの反事実データ拡張技術のいくつかの制限を強調します。
モデルベースのソリューションはこれらの問題を軽減できますが、質的な並行トレーニング データの欠如がこの方向の開発を妨げています。


Counterfactual Data Augmentation (CDA) has been one of the preferred techniques for mitigating gender bias in natural language models. CDA techniques have mostly employed word substitution based on dictionaries. Although such dictionary-based CDA techniques have been shown to significantly improve the mitigation of gender bias, in this paper, we highlight some limitations of such dictionary-based counterfactual data augmentation techniques, such as susceptibility to ungrammatical compositions, and lack of generalization outside the set of predefined dictionary words. Model-based solutions can alleviate these problems, yet the lack of qualitative parallel training data hinders development in this direction. Therefore, we propose a combination of data processing techniques and a bi-objective training regime to develop a model-based solution for generating counterfactuals to mitigate gender bias. We implemented our proposed solution and performed an empirical evaluation which shows how our model alleviates the shortcomings of dictionary-based solutions.


著者 Ewoenam Kwaku Tokpo,Toon Calders
発行日 2023-11-06 15:25:30+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク