要約
アルゴリズムヘイトスピーチ検出は、研究と実践で使用される多様な定義とデータセットのために、重大な課題に直面しています。
ソーシャルメディアプラットフォーム、法的枠組み、および機関はそれぞれ、明確でありながら重複する定義を適用し、分類の取り組みを複雑にします。
この研究では、既存のデータセットと分類法を統一モデルに統合し、予測のパフォーマンスを向上させ、複数の専門分類器への依存を減らすことができることを実証することにより、これらの課題に対処します。
この作品は、単一のフレームワーク内で幅広い定義を検出できる普遍的な分類法とヘイトスピーチ分類器を導入します。
私たちのアプローチは、広く使用されているが異なる注釈付きデータセットを組み合わせることで検証され、独立したテストセットでの分類パフォーマンスが改善されました。
この作業は、ヘイトスピーチの検出を進め、効率を高め、コンテキスト全体でより幅広い適用性を確保することにおけるデータセットと分類統合の可能性を強調しています。
要約(オリジナル)
Algorithmic hate speech detection faces significant challenges due to the diverse definitions and datasets used in research and practice. Social media platforms, legal frameworks, and institutions each apply distinct yet overlapping definitions, complicating classification efforts. This study addresses these challenges by demonstrating that existing datasets and taxonomies can be integrated into a unified model, enhancing prediction performance and reducing reliance on multiple specialized classifiers. The work introduces a universal taxonomy and a hate speech classifier capable of detecting a wide range of definitions within a single framework. Our approach is validated by combining two widely used but differently annotated datasets, showing improved classification performance on an independent test set. This work highlights the potential of dataset and taxonomy integration in advancing hate speech detection, increasing efficiency, and ensuring broader applicability across contexts.
arxiv情報
著者 | Jan Fillies,Adrian Paschke |
発行日 | 2025-03-07 12:01:02+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google