要約
RALM(Retrieval-Augmented Language Model)は、推論時に外部の知識を取り込むことで、大規模言語モデル(LLM)に特有の事実の幻覚を軽減し、知識集約的なタスクにおいて顕著な性能を示している。このような進歩にもかかわらず、RALMの実装には、特にその信頼性とトレーサビリティに関する課題が残っている。具体的には、無関係な文書の検索は、役に立たない応答生成をもたらすか、あるいはLLMの性能を悪化させるかもしれない。一方、生成された出力に適切な引用がないことは、モデルの信頼性を検証する努力を複雑にする。この目的のため、我々はRALMの信頼性とトレーサビリティを向上させることを目的とした新しい自己推論フレームワークを提案する。このフレームワークは、3つのプロセス、すなわち、関連性を考慮したプロセス、証拠を考慮した選択プロセス、および軌跡分析プロセスにより、自己推論の軌跡を構築する。我々は、4つの公開データセット(2つの短文QAデータセット、1つの長文QAデータセット、1つの事実検証データセット)を用いて本フレームワークを評価し、2,000個の学習サンプルを用いるだけで、既存の最新モデルを凌駕し、GPT-4と同等の性能を達成できる本手法の優位性を実証した。
要約(オリジナル)
The Retrieval-Augmented Language Model (RALM) has shown remarkable performance on knowledge-intensive tasks by incorporating external knowledge during inference, which mitigates the factual hallucinations inherited in large language models (LLMs). Despite these advancements, challenges persist in the implementation of RALMs, particularly concerning their reliability and traceability. To be specific, the irrelevant document retrieval may result in unhelpful response generation or even deteriorate the performance of LLMs, while the lack of proper citations in generated outputs complicates efforts to verify the trustworthiness of the models. To this end, we propose a novel self-reasoning framework aimed at improving the reliability and traceability of RALMs, whose core idea is to leverage reasoning trajectories generated by the LLM itself. The framework involves constructing self-reason trajectories with three processes: a relevance-aware process, an evidence-aware selective process, and a trajectory analysis process. We have evaluated our framework across four public datasets (two short-form QA datasets, one long-form QA dataset, and one fact verification dataset) to demonstrate the superiority of our method, which can outperform existing state-of-art models and can achieve comparable performance with GPT-4, while only using 2,000 training samples.
arxiv情報
著者 | Yuan Xia,Jingbo Zhou,Zhenhui Shi,Jun Chen,Haifeng Huang |
発行日 | 2024-08-02 12:11:17+00:00 |
arxivサイト | arxiv_id(pdf) |