Evidentiality-aware Retrieval for Overcoming Abstractiveness in Open-Domain Question Answering

要約

抽象的オープンドメイン質問応答 (ODQA) タスクにおけるデンス リトリーバーの長年の目標は、リーダーが証拠の文章から事実に基づいて正しい出力を生成できるように、任意のクエリに関連する文章の中から証拠の文章を捕捉する方法を学習することです。
主要な課題の 1 つは、パッセージの解答可能性を監視するトレーニング データの量が不十分であることです。
最近の研究では、リーダーからの信号を使用して応答性に注釈を付ける反復パイプラインに依存していますが、計算コストが高いため実用化が妨げられています。
この論文では、代わりにデータ中心のアプローチに焦点を当て、証拠の文章と注意をそらすための合成サンプルを活用して証拠の文章を区別する方法を学習する Evidentiality-Aware Dense Passage Retrieval (EADPR) を提案します。
私たちは、複数の抽象的な ODQA タスクに対する提案手法の有効性を検証するために広範な実験を実施します。

要約(オリジナル)

The long-standing goal of dense retrievers in abtractive open-domain question answering (ODQA) tasks is to learn to capture evidence passages among relevant passages for any given query, such that the reader produce factually correct outputs from evidence passages. One of the key challenge is the insufficient amount of training data with the supervision of the answerability of the passages. Recent studies rely on iterative pipelines to annotate answerability using signals from the reader, but their high computational costs hamper practical applications. In this paper, we instead focus on a data-centric approach and propose Evidentiality-Aware Dense Passage Retrieval (EADPR), which leverages synthetic distractor samples to learn to discriminate evidence passages from distractors. We conduct extensive experiments to validate the effectiveness of our proposed method on multiple abstractive ODQA tasks.

arxiv情報

著者 Yongho Song,Dahyun Lee,Myungha Jang,Seung-won Hwang,Kyungjae Lee,Dongha Lee,Jinyeong Yeo
発行日 2024-02-01 17:36:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI パーマリンク