CrAM: Credibility-Aware Attention Modification in LLMs for Combating Misinformation in RAG

要約

検索拡張生成 (RAG) は、外部ドキュメントを参照することで大規模言語モデル (LLM) の幻覚を軽減できます。
ただし、外部文書の誤った情報は、LLM の生成に誤解を招く可能性があります。
この問題に対処するために、LLM が信頼性スコアに基づいて取得した文書の影響を自動的に調整し、誤った情報に対抗する「信頼性を意識した RAG」のタスクを検討します。
この目的を達成するために、$\textbf{Cr}$edibility-aware $\textbf{A}$ttention $\textbf{M}$odification (CrAM) というプラグ アンド プレイ メソッドを導入します。
CrAM は、LLM 内の影響力のあるアテンションヘッドを特定し、文書の信頼性に基づいてそのアテンションの重みを調整することで、信頼性の低い文書の影響を軽減します。
Llama2-13B、Llama3-8B、Qwen1.5-7B を使用した Natual question と TriviaQA の実験では、CrAM が誤情報汚染に対する LLM の RAG パフォーマンスを 20% 以上向上させ、教師付き微調整手法をも上回っていることが示されています。

要約(オリジナル)

Retrieval-Augmented Generation (RAG) can alleviate hallucinations of Large Language Models (LLMs) by referencing external documents. However, the misinformation in external documents may mislead LLMs’ generation. To address this issue, we explore the task of ‘credibility-aware RAG’, in which LLMs automatically adjust the influence of retrieved documents based on their credibility scores to counteract misinformation. To this end, we introduce a plug-and-play method named $\textbf{Cr}$edibility-aware $\textbf{A}$ttention $\textbf{M}$odification (CrAM). CrAM identifies influential attention heads in LLMs and adjusts their attention weights based on the credibility of the documents, thereby reducing the impact of low-credibility documents. Experiments on Natual Questions and TriviaQA using Llama2-13B, Llama3-8B, and Qwen1.5-7B show that CrAM improves the RAG performance of LLMs against misinformation pollution by over 20%, even surpassing supervised fine-tuning methods.

arxiv情報

著者 Boyi Deng,Wenjie Wang,Fengbin Zhu,Qifan Wang,Fuli Feng
発行日 2024-12-17 14:11:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク