Automated Ableism: An Exploration of Explicit Disability Biases in Sentiment and Toxicity Analysis Models


私たちは感情分析と有害性検出モデルを分析して、障害者 (PWD) に対する明示的な偏見の存在を検出します。
私たちは、摂動感度分析のバイアス特定フレームワークを使用して、ソーシャル メディア プラットフォーム、特に Twitter や Reddit での障害者に関連する会話を調査し、現実世界の社会的環境で障害者バイアスがどのように広まっているかを洞察します。
次に、感情分析および毒性検出モデルにおける明示的な障害バイアスを定量化するために、 \textit{感情におけるバイアス識別テスト} (BITS) コーパスを作成します。
私たちの調査では、BITS を利用して、4 つのオープン AIaaS (AI as a Service) センチメント分析ツール (TextBlob、VADER、Google Cloud Natural Language API、DistilBERT) と 2 つの毒性検出モデル (Toxic-BERT の 2 つのバージョン) における重大なバイアスを明らかにしました。


We analyze sentiment analysis and toxicity detection models to detect the presence of explicit bias against people with disability (PWD). We employ the bias identification framework of Perturbation Sensitivity Analysis to examine conversations related to PWD on social media platforms, specifically Twitter and Reddit, in order to gain insight into how disability bias is disseminated in real-world social settings. We then create the \textit{Bias Identification Test in Sentiment} (BITS) corpus to quantify explicit disability bias in any sentiment analysis and toxicity detection models. Our study utilizes BITS to uncover significant biases in four open AIaaS (AI as a Service) sentiment analysis tools, namely TextBlob, VADER, Google Cloud Natural Language API, DistilBERT and two toxicity detection models, namely two versions of Toxic-BERT. Our findings indicate that all of these models exhibit statistically significant explicit bias against PWD.


著者 Pranav Narayanan Venkit,Mukund Srinath,Shomir Wilson
発行日 2023-07-18 12:45:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.AI, cs.CL, cs.CY, cs.LG パーマリンク