FastFiD: Improve Inference Efficiency of Open Domain Question Answering via Sentence Selection

要約

オープン ドメイン質問応答 (ODQA) は、密なパッセージ検索と事前トレーニングされた言語モデルの大幅な開発によって、最近急速に進歩しています。
現在のモデルには通常、エンコーダー/デコーダー ニューラル リーダーと並んでニューラル リトリーバーによって構成される FiD フレームワークが組み込まれています。
回答生成プロセスでは、取得者は多数のパッセージ (たとえば約 100) を取得し、各パッセージはエンコーダーによって個別にエンコードされます。
その後、デコーダはこれらのエンコードされたパッセージに基づいて予測を行います。
それにもかかわらず、このフレームワークは、特に集められた通路の長さが長いため、比較的時間がかかる可能性があります。
これに対処するために、この論文では、エンコードされたパッセージ上で文の選択を実行する新しいアプローチである FastFiD を紹介します。
これは、回答の生成に必要なコンテキストの長さを削減しながら、貴重な文を保持するのに役立ちます。
一般的に使用される 3 つのデータセット (Natural question、TriviaQA、ASQA) での実験により、私たちの方法がモデルのパフォーマンスを維持しながら、推論速度を 2.3 ~ 5.7 倍向上できることが実証されました。
さらに、モデルの注意を詳細に分析すると、選択された文が実際に最終的な答えに大きく貢献していることが明らかになりました。
コードは https://github.com/thunlp/FastFiD で公開されています。

要約(オリジナル)

Open Domain Question Answering (ODQA) has been advancing rapidly in recent times, driven by significant developments in dense passage retrieval and pretrained language models. Current models typically incorporate the FiD framework, which is composed by a neural retriever alongside an encoder-decoder neural reader. In the answer generation process, the retriever will retrieve numerous passages (around 100 for instance), each of which is then individually encoded by the encoder. Subsequently, the decoder makes predictions based on these encoded passages. Nevertheless, this framework can be relatively time-consuming, particularly due to the extensive length of the gathered passages. To address this, we introduce FastFiD in this paper, a novel approach that executes sentence selection on the encoded passages. This aids in retaining valuable sentences while reducing the context length required for generating answers. Experiments on three commonly used datasets (Natural Questions, TriviaQA and ASQA) demonstrate that our method can enhance the inference speed by 2.3X-5.7X, while simultaneously maintaining the model’s performance. Moreover, an in-depth analysis of the model’s attention reveals that the selected sentences indeed hold a substantial contribution towards the final answer. The codes are publicly available at https://github.com/thunlp/FastFiD.

arxiv情報

著者 Yufei Huang,Xu Han,Maosong Sun
発行日 2024-08-12 17:50:02+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク