Learning to Plan and Generate Text with Citations

要約

情報探索シナリオにおけるLLMの配備に対する要求の高まりは、クエリに対する応答を裏付け証拠とともに生成する、検証可能なシステムの構築に拍車をかけている。本稿では、生成されたテキストの忠実性、根拠性、制御性を向上させることが最近示されている、プランに基づくモデルの帰属能力を探索する。我々はプランを、生成されたコンテンツとその構成の青写真として機能する一連の質問として概念化する。質問がゼロから生成される抽象的モデルと、質問が入力からコピーされる抽出的モデルである。長文質問応答に関する実験から、プランニングは一貫して帰属の質を向上させることが示された。さらに、青写真モデルによって生成された引用は、計画コンポーネントを欠いたLLMベースのパイプラインから得られたものと比較して、より正確である。

要約(オリジナル)

The increasing demand for the deployment of LLMs in information-seeking scenarios has spurred efforts in creating verifiable systems, which generate responses to queries along with supporting evidence. In this paper, we explore the attribution capabilities of plan-based models which have been recently shown to improve the faithfulness, grounding, and controllability of generated text. We conceptualize plans as a sequence of questions which serve as blueprints of the generated content and its organization. We propose two attribution models that utilize different variants of blueprints, an abstractive model where questions are generated from scratch, and an extractive model where questions are copied from the input. Experiments on long-form question-answering show that planning consistently improves attribution quality. Moreover, the citations generated by blueprint models are more accurate compared to those obtained from LLM-based pipelines lacking a planning component.

arxiv情報

著者 Constanza Fierro,Reinald Kim Amplayo,Fantine Huot,Nicola De Cao,Joshua Maynez,Shashi Narayan,Mirella Lapata
発行日 2024-04-04 11:27:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CL パーマリンク