要約
ナレーションは事象を説明し理解するために不可欠であり、関連する複数のナレーションはしばしば関心のある事象の全体像を把握するのに役立つため、類似ナレーションの検索は極めて重要なタスクである。意味的に類似した語りを正確に識別するために、本論文では、古典的な5W1Hファセット(Who、What、When、Where、Why、How)に基づく、ファセットに基づく語りの類似度(FaNS)と呼ばれる新しい類似度メトリックを提案する。FaNSは、全体的な語彙的・意味的一致にのみ焦点を当てた既存の類似性測定基準とは異なり、6つの異なるファセットに沿ったより詳細なマッチングを独立に提供し、それらを組み合わせる。FaNSを評価するために、我々はAllSidesという第三者のニュースポータルからナレーションを収集し、包括的なデータセットを作成した。実験の結果、FaNSメトリックは、ナラティブ間の語彙的/意味的一致を直接測定する従来のテキスト類似性メトリックよりも高い相関(37%高い)を示し、一対のナラティブ間のより細かい詳細を比較する際に有効であることが実証された。
要約(オリジナル)
Similar Narrative Retrieval is a crucial task since narratives are essential for explaining and understanding events, and multiple related narratives often help to create a holistic view of the event of interest. To accurately identify semantically similar narratives, this paper proposes a novel narrative similarity metric called Facet-based Narrative Similarity (FaNS), based on the classic 5W1H facets (Who, What, When, Where, Why, and How), which are extracted by leveraging the state-of-the-art Large Language Models (LLMs). Unlike existing similarity metrics that only focus on overall lexical/semantic match, FaNS provides a more granular matching along six different facets independently and then combines them. To evaluate FaNS, we created a comprehensive dataset by collecting narratives from AllSides, a third-party news portal. Experimental results demonstrate that the FaNS metric exhibits a higher correlation (37\% higher) than traditional text similarity metrics that directly measure the lexical/semantic match between narratives, demonstrating its effectiveness in comparing the finer details between a pair of narratives.
arxiv情報
著者 | Mousumi Akter,Shubhra Kanti Karmaker Santu |
発行日 | 2024-03-02 14:46:27+00:00 |
arxivサイト | arxiv_id(pdf) |