Improved Beam Search for Hallucination Mitigation in Abstractive Summarization

要約

大規模な事前トレーニング済み言語モデルの進歩により、幻覚はあるものの、要約などの条件付き言語生成タスクのパフォーマンスが大幅に向上しました。
幻覚を軽減するために、従来の方法では、ビームサーチを改善するか、後処理ステップとしてファクトチェッカーを使用することが提案されていました。
この論文では、要約生成における幻覚を検出および防止するための自然言語推論 (NLI) 含意メトリックの使用について調査します。
顕著性強化貪欲復号中に入力コンテキストと要約モデル生成ビーム間の含意確率スコアを計算することにより、NLI 支援ビーム再ランキング メカニズムを提案します。
さらに、バニラ ビーム検索との有効性を比較するために、ダイバーシティ メトリックが導入されています。
私たちが提案したアルゴリズムは、XSum および CNN/DM データセットに対するバニラ ビーム デコーディングを大幅に上回ります。

要約(オリジナル)

Advancement in large pretrained language models has significantly improved their performance for conditional language generation tasks including summarization albeit with hallucinations. To reduce hallucinations, conventional methods proposed improving beam search or using a fact checker as a postprocessing step. In this paper, we investigate the use of the Natural Language Inference (NLI) entailment metric to detect and prevent hallucinations in summary generation. We propose an NLI-assisted beam re-ranking mechanism by computing entailment probability scores between the input context and summarization model-generated beams during saliency-enhanced greedy decoding. Moreover, a diversity metric is introduced to compare its effectiveness against vanilla beam search. Our proposed algorithm significantly outperforms vanilla beam decoding on XSum and CNN/DM datasets.

arxiv情報

著者 Arvind Krishna Sridhar,Erik Visser
発行日 2023-11-14 17:12:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク