ChatGPT as a Text Simplification Tool to Remove Bias

要約

タイトル:ChatGPTによる偏見除去のためのテキスト簡素化ツール

要約:
– 言語モデルがトレーニング中に特定の人々のグループに特有の言語シグナルを拾えるため、差別的な結果になる可能性がある。
– 言語モデルが特定のグループの言葉に頼るように学習した場合、その言葉に基づく決定は保護された特徴に基づく決定と密接に相関する。
– テキストを簡素化することで、言語の標準化を行いつつ同じ意味を維持することができ、バイアスの軽減の可能性がある。
– この実験では、テキストを簡素化することで、機密データの予測に対する分類器の精度が最大で17%下がるという有望な結果が示された。

要約(オリジナル)

The presence of specific linguistic signals particular to a certain sub-group of people can be picked up by language models during training. This may lead to discrimination if the model has learnt to pick up on a certain group’s language. If the model begins to associate specific language with a distinct group, any decisions made based upon this language would hold a strong correlation to a decision based on their protected characteristic. We explore a possible technique for bias mitigation in the form of simplification of text. The driving force of this idea is that simplifying text should standardise language to one way of speaking while keeping the same meaning. The experiment shows promising results as the classifier accuracy for predicting the sensitive attribute drops by up to 17% for the simplified data.

arxiv情報

著者 Charmaine Barker,Dimitar Kazakov
発行日 2023-05-09 13:10:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク