要約
有害な言語が女性や疎外されたグループに不釣り合いに影響を与えるため、オンラインコンテンツでの性差別の検出は未解決の問題のままです。
性差別検出のための自動化されたシステムが開発されていますが、それらは依然として2つの重要な課題に直面しています:データスパース性と性差別的言語の微妙な性質。
オンライン性差別(EDOS)の説明可能な検出のような大規模で十分にキュレーションされたデータセットでさえ、深刻なクラスの不均衡はモデルの一般化を妨げます。
さらに、微調整されたカテゴリの重複と曖昧な境界は、性差別の微妙な表現を解釈することの難しさを反映して、かなりの注釈者の意見の不一致をもたらします。
これらの課題に対処するために、2つのプロンプトベースのデータ増強技術を提案します:定義ベースのデータ増強(DDA)は、カテゴリ固有の定義を活用して、セマンティックに整列した合成例を生成し、コンテキストセマンティック拡張(CSE)を生成します。
細粒分類の信頼性をさらに向上させるために、複数の言語モデルから補完的な視点を集約することにより、予測関係を解決するアンサンブル戦略を導入します。
EDOSデータセットでの実験的評価は、すべてのタスクにわたって最先端のパフォーマンスを示しており、マクロF1の顕著な改善は、バイナリ分類で1.5ポイント(タスクA)、細粒分類で4.1ポイント(タスクC)を示しています。
要約(オリジナル)
The detection of sexism in online content remains an open problem, as harmful language disproportionately affects women and marginalized groups. While automated systems for sexism detection have been developed, they still face two key challenges: data sparsity and the nuanced nature of sexist language. Even in large, well-curated datasets like the Explainable Detection of Online Sexism (EDOS), severe class imbalance hinders model generalization. Additionally, the overlapping and ambiguous boundaries of fine-grained categories introduce substantial annotator disagreement, reflecting the difficulty of interpreting nuanced expressions of sexism. To address these challenges, we propose two prompt-based data augmentation techniques: Definition-based Data Augmentation (DDA), which leverages category-specific definitions to generate semantically-aligned synthetic examples, and Contextual Semantic Expansion (CSE), which targets systematic model errors by enriching examples with task-specific semantic features. To further improve reliability in fine-grained classification, we introduce an ensemble strategy that resolves prediction ties by aggregating complementary perspectives from multiple language models. Our experimental evaluation on the EDOS dataset demonstrates state-of-the-art performance across all tasks, with notable improvements of macro F1 by 1.5 points for binary classification (Task A) and 4.1 points for fine-grained classification (Task C).
arxiv情報
著者 | Sahrish Khan,Arshad Jhumka,Gabriele Pergola |
発行日 | 2025-06-06 16:58:12+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google