要約
オープンドメイン質問回答 (ODQA) タスクには、データベース内のきめ細かい関連する文章から回答を取得し、その後生成することが含まれます。
現在のシステムは、事前トレーニング済み言語モデル (PLM) を利用して、質問と文章の関係をモデル化しています。
ただし、表面形状の表現の多様性により、特に複雑なコンテキスト内で正確な相関関係を捕捉するモデルの能力が妨げられる可能性があります。
したがって、抽象意味表現 (AMR) グラフを利用して、モデルが複雑な意味情報を理解するのを支援します。
AMR を PLM に組み込むために、Graph-as-Token (GST) として知られる方法を導入します。
Natural question (NQ) と TriviaQA (TQ) の結果は、GST メソッドがパフォーマンスを大幅に向上させ、NQ/TQ でそれぞれ最大 2.44/3.17 の完全一致スコアが向上することを示しています。
さらに、私たちの方法は堅牢性を強化し、AMR を統合するための代替のグラフ ニューラル ネットワーク (GNN) 方法よりも優れています。
私たちの知る限り、ODQA でセマンティック グラフを採用したのは私たちが初めてです。
要約(オリジナル)
The Open-Domain Question Answering (ODQA) task involves retrieving and subsequently generating answers from fine-grained relevant passages within a database. Current systems leverage Pretrained Language Models (PLMs) to model the relationship between questions and passages. However, the diversity in surface form expressions can hinder the model’s ability to capture accurate correlations, especially within complex contexts. Therefore, we utilize Abstract Meaning Representation (AMR) graphs to assist the model in understanding complex semantic information. We introduce a method known as Graph-as-Token (GST) to incorporate AMRs into PLMs. Results from Natural Questions (NQ) and TriviaQA (TQ) demonstrate that our GST method can significantly improve performance, resulting in up to 2.44/3.17 Exact Match score improvements on NQ/TQ respectively. Furthermore, our method enhances robustness and outperforms alternative Graph Neural Network (GNN) methods for integrating AMRs. To the best of our knowledge, we are the first to employ semantic graphs in ODQA.
arxiv情報
著者 | Cunxiang Wang,Zhikun Xu,Qipeng Guo,Xiangkun Hu,Xuefeng Bai,Zheng Zhang,Yue Zhang |
発行日 | 2023-05-26 16:00:16+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google