要約
テキスト内のバイアス検出は、否定的な固定観念、誤った情報、偏った意思決定の蔓延と戦うために非常に重要です。
従来の言語モデルは、トレーニング データを超えて一般化する際に課題に直面することが多く、通常は単一のタスク向けに設計されており、文レベルでのバイアス検出に焦点を当てていることがよくあります。
これに対処するために、Contextualized Bi-Directional Dual Transformer (CBDT) \textcolor{green}{\faLeaf} 分類子を紹介します。
このモデルは、バイアス検出機能の向上に重点を置いて、コンテキスト トランスフォーマーとエンティティ トランスフォーマーという 2 つの相補的なトランスフォーマー ネットワークを組み合わせています。
私たちは、テキスト内のバイアスを特定して特定するためにこれらのモデルをトレーニングするためのデータセットを特別に準備しました。
さまざまなデータセットにわたる評価では、偏った物語と中立的な物語を区別し、特定の偏った用語を特定する際に CBDT \textcolor{green} が有効であることが実証されました。
この研究は、CBDT \textcolor{green} モデルをさまざまな言語的および文化的文脈に適用する道を開き、バイアス検出の取り組みにおけるその有用性を高めます。
また、注釈付きのデータセットを研究目的で利用できるようにします。
要約(オリジナル)
Bias detection in text is crucial for combating the spread of negative stereotypes, misinformation, and biased decision-making. Traditional language models frequently face challenges in generalizing beyond their training data and are typically designed for a single task, often focusing on bias detection at the sentence level. To address this, we present the Contextualized Bi-Directional Dual Transformer (CBDT) \textcolor{green}{\faLeaf} classifier. This model combines two complementary transformer networks: the Context Transformer and the Entity Transformer, with a focus on improving bias detection capabilities. We have prepared a dataset specifically for training these models to identify and locate biases in texts. Our evaluations across various datasets demonstrate CBDT \textcolor{green} effectiveness in distinguishing biased narratives from neutral ones and identifying specific biased terms. This work paves the way for applying the CBDT \textcolor{green} model in various linguistic and cultural contexts, enhancing its utility in bias detection efforts. We also make the annotated dataset available for research purposes.
arxiv情報
著者 | Shaina Raza,Oluwanifemi Bamgbose,Veronica Chatrath,Shardul Ghuge,Yan Sidyakin,Abdullah Y Muaad |
発行日 | 2024-04-17 11:48:11+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google