要約
最近の調査では、多くのオンラインのヘイト スピーチが暗黙のうちに行われていることが警告されています。
その微妙な性質により、このようなヘイトスピーチの検出の説明可能性は困難な問題でした。
この作業では、ChatGPT を使用して、暗黙のヘイトスピーチ検出のための自然言語説明 (NLE) を提供できるかどうかを調べます。
ChatGPT で生成された簡潔な NLE を引き出すようにプロンプトを設計し、ユーザー調査を実施して、人間が作成した NLE と比較してその品質を評価します。
暗黙のヘイトスピーチ研究の文脈で、ChatGPT の可能性と限界について説明します。
要約(オリジナル)
Recent studies have alarmed that many online hate speeches are implicit. With its subtle nature, the explainability of the detection of such hateful speech has been a challenging problem. In this work, we examine whether ChatGPT can be used for providing natural language explanations (NLEs) for implicit hateful speech detection. We design our prompt to elicit concise ChatGPT-generated NLEs and conduct user studies to evaluate their qualities by comparison with human-written NLEs. We discuss the potential and limitations of ChatGPT in the context of implicit hateful speech research.
arxiv情報
著者 | Fan Huang,Haewoon Kwak,Jisun An |
発行日 | 2023-03-15 19:16:45+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google