FactCHD: Benchmarking Fact-Conflicting Hallucination Detection

要約

LLM はその優れた生成能力にもかかわらず、現実世界のアプリケーションでは事実と矛盾する幻覚によって妨げられます。
特に複雑な推論シナリオにおいて、LLM によって生成されたテキスト内の幻覚を正確に識別することは、比較的未開発の領域です。
このギャップに対処するために、LLM からの事実に矛盾する幻覚を検出するために設計された専用ベンチマークである FactCHD を紹介します。
FactCHD は、バニラ、マルチホップ、比較、集合演算など、さまざまな事実パターンにまたがる多様なデータセットを特徴としています。
FactCHD の特徴的な要素は、事実に基づく証拠チェーンの統合であり、検出器の説明の評価の深さを大幅に強化します。
さまざまな LLM での実験により、事実上の誤りを正確に検出する際の現在のアプローチの欠点が明らかになりました。
さらに、ツール強化された ChatGPT と Llama2 に基づく LoRA チューニングによる反射的考慮事項を合成する Truth-Triangulator を導入し、予測結果と証拠の融合を通じてより信頼性の高い検出を生み出すことを目指しています。
ベンチマーク データセットは https://github.com/zjunlp/FactCHD で入手できます。

要約(オリジナル)

Despite their impressive generative capabilities, LLMs are hindered by fact-conflicting hallucinations in real-world applications. The accurate identification of hallucinations in texts generated by LLMs, especially in complex inferential scenarios, is a relatively unexplored area. To address this gap, we present FactCHD, a dedicated benchmark designed for the detection of fact-conflicting hallucinations from LLMs. FactCHD features a diverse dataset that spans various factuality patterns, including vanilla, multi-hop, comparison, and set operation. A distinctive element of FactCHD is its integration of fact-based evidence chains, significantly enhancing the depth of evaluating the detectors’ explanations. Experiments on different LLMs expose the shortcomings of current approaches in detecting factual errors accurately. Furthermore, we introduce Truth-Triangulator that synthesizes reflective considerations by tool-enhanced ChatGPT and LoRA-tuning based on Llama2, aiming to yield more credible detection through the amalgamation of predictive results and evidence. The benchmark dataset is available at https://github.com/zjunlp/FactCHD.

arxiv情報

著者 Xiang Chen,Duanzheng Song,Honghao Gui,Chenxi Wang,Ningyu Zhang,Jiang Yong,Fei Huang,Chengfei Lv,Dan Zhang,Huajun Chen
発行日 2024-01-18 16:20:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.CV, cs.IR, cs.LG パーマリンク