MIX : a Multi-task Learning Approach to Solve Open-Domain Question Answering

要約

このペーパーでは、オープンエンドの質問を解決するためのマルチタスクディープラーニングアプローチであるMixを紹介します。
まず、システムを3つのビルディングブロックのマルチステージパイプラインとして設計します。検索スペースを削減するためのBM25ベースのレトリバー、ロベルタベースの得点者、およびそれぞれ検索された段落をランク付けし、関連するテキストスパンを抽出する抽出器です。
最終的には、スケーラビリティチャレンジに対処するためにシステムの計算効率をさらに改善します。マルチタスク学習のおかげで、スコアラーと抽出器によって解決された緊密なタスクに並行しています。
私たちのシステムは、概念的にシンプルである一方で、チームオープンベンチマークで最先端のパフォーマンスと同等です。

要約(オリジナル)

This paper introduces MIX, a multi-task deep learning approach to solve open-ended question-answering. First, we design our system as a multi-stage pipeline of 3 building blocks: a BM25-based Retriever to reduce the search space, a RoBERTa-based Scorer, and an Extractor to rank retrieved paragraphs and extract relevant text spans, respectively. Eventually, we further improve the computational efficiency of our system to deal with the scalability challenge: thanks to multi-task learning, we parallelize the close tasks solved by the Scorer and the Extractor. Our system is on par with state-of-the-art performances on the squad-open benchmark while being simpler conceptually.

arxiv情報

著者 Sofian Chaybouti,Achraf Saghe,Aymen Shabou
発行日 2025-03-13 13:56:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, I.2.7 パーマリンク