要約
有名な個人からの心に強く訴える引用は、ニュース記事、エッセイ、日常の会話で考えを伝えるためによく使用されます。
この論文では、長いテキストから最も関連性の高い引用を抽出することを目的とする新しいコンテキストベースの引用抽出システムを提案します。
この引用抽出は、最初にベクトルストアベースのレトリバーを使用して、マルチタスクリーダーを適用することにより、まずオープンドメインの質問に応答する問題になります。
3つのコンテキストベースの引用抽出データセットをキュレートし、最先端のパフォーマンスを向上させる新しいマルチタスクフレームワークRA-MTRを導入し、Bow F1スコアで5.08%の最大改善を達成します。
要約(オリジナル)
Inspirational quotes from famous individuals are often used to convey thoughts in news articles, essays, and everyday conversations. In this paper, we propose a novel context-based quote extraction system that aims to extract the most relevant quote from a long text. We formulate this quote extraction as an open domain question answering problem first by employing a vector-store based retriever and then applying a multi-task reader. We curate three context-based quote extraction datasets and introduce a novel multi-task framework RA-MTR that improves the state-of-the-art performance, achieving a maximum improvement of 5.08% in BoW F1-score.
arxiv情報
著者 | Sayantan Adak,Animesh Mukherjee |
発行日 | 2025-02-17 18:46:46+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google