ReAgent: Reversible Multi-Agent Reasoning for Knowledge-Enhanced Multi-Hop QA

要約

大規模な言語モデル(LLMS)の最近の進歩により、直接的なチェーン(COT)推論を通じて、マルチホップの質問回答(QA)が大幅に改善されました。
ただし、COTの不可逆的な性質はエラーの蓄積につながり、マルチホップの推論で間違いを修正することが困難になります。
このホワイトペーパーでは、試薬を紹介します。明示的なバックトラッキングメカニズムで増強された可逆的なマルチエージェントコラボレーションフレームワークを紹介し、可逆的なマルチホップ推論を可能にします。
テキストベースの検索、情報の集約、および検証を組み込むことにより、システムは季節の途中でエラーを検出して修正し、より堅牢で解釈可能なQAの結果につながります。
フレームワークと実験は、エラートレラントQAシステムに関する将来の作業の基盤として機能します。
3つのベンチマークにわたる経験的評価は、試薬の有効性を示しており、ベースラインモデルに対する平均約6 \%の改善をもたらします。

要約(オリジナル)

Recent advances in large language models (LLMs) have significantly improved multi-hop question answering (QA) through direct Chain-of-Thought (CoT) reasoning. However, the irreversible nature of CoT leads to error accumulation, making it challenging to correct mistakes in multi-hop reasoning. This paper introduces ReAgent: a Reversible multi-Agent collaborative framework augmented with explicit backtracking mechanisms, enabling reversible multi-hop reasoning. By incorporating text-based retrieval, information aggregation and validation, our system can detect and correct errors mid-reasoning, leading to more robust and interpretable QA outcomes. The framework and experiments serve as a foundation for future work on error-tolerant QA systems. Empirical evaluations across three benchmarks indicate ReAgent’s efficacy, yielding average about 6\% improvements against baseline models.

arxiv情報

著者 Xinjie Zhao,Fan Gao,Xingyu Song,Yingjian Chen,Rui Yang,Yanran Fu,Yuyang Wang,Yusuke Iwasawa,Yutaka Matsuo,Irene Li
発行日 2025-05-29 17:37:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク