Coarse-to-Fine Knowledge Selection for Document Grounded Dialogs

要約

マルチドキュメント グラウンデッド ダイアログ システム (DGDS) は、ドキュメントのコレクションから補助的な知識を見つけてユーザーの要求に答える会話エージェントのクラスに属します。
以前の研究のほとんどは、知識検索モデルを改善するか、外部知識をパラメトリック生成モデルに組み込むためのより効果的な方法を提案することを目的としています。
ただし、これらの方法は、単粒度の言語単位 (ドキュメント内のパッセージ、センテンス、またはスパンなど) から知識を取得することに重点を置いており、長いドキュメントで正確な知識を効果的かつ効率的に取得するには不十分です。
この論文では、統一されたフレームワークで粗粒度の知識検索と細粒度の知識抽出の両方を最適化することを目的とした Re3G を提案します。
具体的には、前者は検索と再ランキングのプロセスで関連するパッセージを効率的に見つけますが、後者はそれらのパッセージ内のより細かいスパンを効果的に抽出して、パラメトリック回答生成モデル (BART、T5) に組み込みます。
DialDoc 共有タスクの実験は、我々の方法の有効性を示しています。

要約(オリジナル)

Multi-document grounded dialogue systems (DGDS) belong to a class of conversational agents that answer users’ requests by finding supporting knowledge from a collection of documents. Most previous studies aim to improve the knowledge retrieval model or propose more effective ways to incorporate external knowledge into a parametric generation model. These methods, however, focus on retrieving knowledge from mono-granularity language units (e.g. passages, sentences, or spans in documents), which is not enough to effectively and efficiently capture precise knowledge in long documents. This paper proposes Re3G, which aims to optimize both coarse-grained knowledge retrieval and fine-grained knowledge extraction in a unified framework. Specifically, the former efficiently finds relevant passages in a retrieval-and-reranking process, whereas the latter effectively extracts finer-grain spans within those passages to incorporate into a parametric answer generation model (BART, T5). Experiments on DialDoc Shared Task demonstrate the effectiveness of our method.

arxiv情報

著者 Yeqin Zhang,Haomin Fu,Cheng Fu,Haiyang Yu,Yongbin Li,Cam-Tu Nguyen
発行日 2023-02-23 08:28:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク