Chain of Explanation: New Prompting Method to Generate Higher Quality Natural Language Explanation for Implicit Hate Speech

要約

最近の研究では、高度な生成言語モデルを活用して、特定のテキストが嫌悪感を与える理由について自然言語説明 (NLE) を生成しています。
暗黙のヘイトスピーチに対して高品質のNLEを生成するために、ヒューリスティックな単語とターゲットグループを使用して、説明の連鎖(CoE)プロンプト方法を提案します。
正確なターゲット情報を提供することで、NLE 生成の BLUE スコアを 44.0 から 62.3 に改善しました。
次に、生成された NLE の品質を、さまざまな自動メトリクスと、有益性と明快さのスコアの人間による注釈を使用して評価します。

要約(オリジナル)

Recent studies have exploited advanced generative language models to generate Natural Language Explanations (NLE) for why a certain text could be hateful. We propose the Chain of Explanation (CoE) Prompting method, using the heuristic words and target group, to generate high-quality NLE for implicit hate speech. We improved the BLUE score from 44.0 to 62.3 for NLE generation by providing accurate target information. We then evaluate the quality of generated NLE using various automatic metrics and human annotations of informativeness and clarity scores.

arxiv情報

著者 Fan Huang,Haewoon Kwak,Jisun An
発行日 2023-03-15 19:53:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク