‘Define Your Terms’ : Enhancing Efficient Offensive Speech Classification with Definition

要約

ソーシャルメディアチャンネルを通じた攻撃的なコンテンツの伝播は、研究コミュニティの注目を集めている。複数の研究が、意味的に関連しながらも微妙に異なる攻撃的な音声のカテゴリを提案している。本研究では、攻撃的なスピーチコーパスの多様性を活用し、信頼性が高く効率的な検出を強化するためのメタ学習アプローチを探求する。我々は、プロトタイプネットワークを介した分類のために、入力のラベルと定義を組み込んだ結合埋め込みアーキテクチャを提案する。我々のモデルは、4つのデータセットにおいて、利用可能な学習データの10%未満しか使用しないにもかかわらず、最大F1スコアの75%以上を達成した。また、我々の実験結果は、リソース不足に対抗するための貴重な訓練戦略のケーススタディを提供する。

要約(オリジナル)

The propagation of offensive content through social media channels has garnered attention of the research community. Multiple works have proposed various semantically related yet subtle distinct categories of offensive speech. In this work, we explore meta-earning approaches to leverage the diversity of offensive speech corpora to enhance their reliable and efficient detection. We propose a joint embedding architecture that incorporates the input’s label and definition for classification via Prototypical Network. Our model achieves at least 75% of the maximal F1-score while using less than 10% of the available training data across 4 datasets. Our experimental findings also provide a case study of training strategies valuable to combat resource scarcity.

arxiv情報

著者 Huy Nghiem,Umang Gupta,Fred Morstatter
発行日 2024-02-05 17:33:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク