Extreme Classification for Answer Type Prediction in Question Answering



– 解答タイプ予測は、効果的なQAシステムに向けた有用な段階である。
– 解答タイプ予測は自然言語の質問に対して、トップ-k個の知識グラフ(KG)タイプを予測することを含む。
– KGには多数のタイプがあるため、予測は困難である。
– 本論文では、Transformerモデルを用いた極限マルチラベル分類(XBERT)を提案し、質問テキストに基づいた構造的および意味的な特徴を用いてKGタイプのクラスタリングを行うことを提案する。
– XBERTパイプラインのクラスタリングステージを、KGから派生したテキスト的および構造的特徴を用いて改善する。
– これらの特徴が、SMARTタスクのエンドツーエンド性能を改善し、最先端の結果を生み出すことを示す。


Semantic answer type prediction (SMART) is known to be a useful step towards effective question answering (QA) systems. The SMART task involves predicting the top-$k$ knowledge graph (KG) types for a given natural language question. This is challenging due to the large number of types in KGs. In this paper, we propose use of extreme multi-label classification using Transformer models (XBERT) by clustering KG types using structural and semantic features based on question text. We specifically improve the clustering stage of the XBERT pipeline using textual and structural features derived from KGs. We show that these features can improve end-to-end performance for the SMART task, and yield state-of-the-art results.


著者 Vinay Setty
発行日 2023-04-24 19:08:51+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.AI, cs.CL, cs.IR パーマリンク