要約
インターネット上で利用可能な大量および増加している量のデータは、手動の主張と事実検証という面倒なタスクと相まって、自動化されたクレーム検証システムの開発への関心を呼び起こしました。
長年にわたってこのタスクのために、いくつかの深い学習および変圧器ベースのモデルが提案されてきました。
大規模な言語モデル(LLMS)の導入といくつかのNLPタスクでの優れたパフォーマンスにより、検索拡張生成(RAG)などの新しい方法の使用とともに検証を主張するLLMベースのアプローチの急増が見られました。
この調査では、LLMSを使用した最近のクレーム検証フレームワークの包括的な説明を提示します。
これらのフレームワークで使用されているクレーム検証パイプラインのさまざまなコンポーネントについて、検索、プロンプト、および微調整への一般的なアプローチを含め、詳細に説明します。
最後に、このタスクのために作成された一般に利用可能な英語のデータセットについて説明します。
要約(オリジナル)
The large and ever-increasing amount of data available on the Internet coupled with the laborious task of manual claim and fact verification has sparked the interest in the development of automated claim verification systems. Several deep learning and transformer-based models have been proposed for this task over the years. With the introduction of Large Language Models (LLMs) and their superior performance in several NLP tasks, we have seen a surge of LLM-based approaches to claim verification along with the use of novel methods such as Retrieval Augmented Generation (RAG). In this survey, we present a comprehensive account of recent claim verification frameworks using LLMs. We describe the different components of the claim verification pipeline used in these frameworks in detail including common approaches to retrieval, prompting, and fine-tuning. Finally, we describe publicly available English datasets created for this task.
arxiv情報
著者 | Alphaeus Dmonte,Roland Oruche,Marcos Zampieri,Prasad Calyam,Isabelle Augenstein |
発行日 | 2025-02-11 14:51:08+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google