REVERSUM: A Multi-staged Retrieval-Augmented Generation Method to Enhance Wikipedia Tail Biographies through Personal Narratives

要約

ウィキペディアは、幅広いエンティティに関する事実情報のための非常に貴重なリソースです。
ただし、あまり知られていないエンティティの記事の品質は、よく知られているエンティティの品質に遅れをとっています。
この研究は、自伝や伝記などの個人的な物語を活用することにより、ウィキペディアのBおよびCカテゴリの伝記記事を強化するための新しいアプローチを提案しています。
マルチステージの検索された高級世代のテクニック – Reversumを利用することにより、これらのあまり知られていない記事の情報コンテンツを豊かにすることを目指しています。
私たちの研究は、個人的な物語がウィキペディアの記事の品質を大幅に改善し、以前の研究で十分に活用されていない信頼できる情報の豊富な情報源を提供できることを明らかにしています。
群衆ベースの評価に基づいて、Reversum生成コンテンツは、元のWikipediaの記事との統合性の点で、最高のパフォーマンスのベースラインよりも17%、情報性の点で28.5 \%よりも優れています。
コードとデータは、https://github.com/sayantan11995/wikipedia_enrichmentで入手できます

要約(オリジナル)

Wikipedia is an invaluable resource for factual information about a wide range of entities. However, the quality of articles on less-known entities often lags behind that of the well-known ones. This study proposes a novel approach to enhancing Wikipedia’s B and C category biography articles by leveraging personal narratives such as autobiographies and biographies. By utilizing a multi-staged retrieval-augmented generation technique — REVerSum — we aim to enrich the informational content of these lesser-known articles. Our study reveals that personal narratives can significantly improve the quality of Wikipedia articles, providing a rich source of reliable information that has been underutilized in previous studies. Based on crowd-based evaluation, REVerSum generated content outperforms the best performing baseline by 17% in terms of integrability to the original Wikipedia article and 28.5\% in terms of informativeness. Code and Data are available at: https://github.com/sayantan11995/wikipedia_enrichment

arxiv情報

著者 Sayantan Adak,Pauras Mangesh Meher,Paramita Das,Animesh Mukherjee
発行日 2025-02-17 18:53:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.IR パーマリンク