要約
オープンドメインの質問応答において、あいまいな質問を検出して答えることは困難な作業でした。
曖昧な質問は、その解釈によって異なる答えが得られ、さまざまな形をとる可能性があります。
時間的に曖昧な質問は、そのような質問の最も一般的なタイプの 1 つです。
この論文では、既存のデータセットから派生した 8,162 個のオープンドメイン質問で構成される、手動で注釈が付けられた時間的に曖昧な QA データセットである TEMPAMBIQA を紹介します。
私たちのアノテーションは、時間的に曖昧な質問を検出するタスクを研究するために、時間的に曖昧さを捉えることに焦点を当てています。
曖昧さのない質問に基づいて、多様な検索戦略を使用することで、新しいアプローチを提案します。
また、ゼロショットおよび少数ショットのアプローチを使用して時間的曖昧さを検出するための非検索の競合ベースラインを導入およびテストします。
要約(オリジナル)
Detecting and answering ambiguous questions has been a challenging task in open-domain question answering. Ambiguous questions have different answers depending on their interpretation and can take diverse forms. Temporally ambiguous questions are one of the most common types of such questions. In this paper, we introduce TEMPAMBIQA, a manually annotated temporally ambiguous QA dataset consisting of 8,162 open-domain questions derived from existing datasets. Our annotations focus on capturing temporal ambiguity to study the task of detecting temporally ambiguous questions. We propose a novel approach by using diverse search strategies based on disambiguated versions of the questions. We also introduce and test non-search, competitive baselines for detecting temporal ambiguity using zero-shot and few-shot approaches.
arxiv情報
著者 | Bhawna Piryani,Abdelrahman Abdallah,Jamshid Mozafari,Adam Jatowt |
発行日 | 2024-09-25 15:59:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google