Chain of Explanation: New Prompting Method to Generate Higher Quality Natural Language Explanation for Implicit Hate Speech


最近の研究では、高度な生成言語モデルを活用して、特定のテキストが嫌悪感を与える理由について自然言語説明 (NLE) を生成しています。
正確なターゲット情報を提供することで、NLE 生成の BLUE スコアを 44.0 から 62.3 に改善しました。
次に、生成された NLE の品質を、さまざまな自動メトリクスと、有益性と明快さのスコアの人間による注釈を使用して評価します。


Recent studies have exploited advanced generative language models to generate Natural Language Explanations (NLE) for why a certain text could be hateful. We propose the Chain of Explanation (CoE) Prompting method, using the heuristic words and target group, to generate high-quality NLE for implicit hate speech. We improved the BLUE score from 44.0 to 62.3 for NLE generation by providing accurate target information. We then evaluate the quality of generated NLE using various automatic metrics and human annotations of informativeness and clarity scores.


著者 Fan Huang,Haewoon Kwak,Jisun An
発行日 2023-03-15 19:53:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL パーマリンク