要約
インターネット上で利用可能な大量のデータが増え続けていることと、手動による請求および事実確認という骨の折れる作業が相まって、自動請求確認システムの開発への関心が高まっています。
長年にわたって、このタスクのためにいくつかの深層学習およびトランスフォーマーベースのモデルが提案されてきました。
大規模言語モデル (LLM) の導入と、いくつかの NLP タスクにおけるその優れたパフォーマンスにより、検索拡張生成 (RAG) などの新しい手法の使用と併せて、クレーム検証のための LLM ベースのアプローチが急増しています。
この調査では、LLM を使用した最近の請求検証フレームワークの包括的な説明を示します。
これらのフレームワークで使用されるクレーム検証パイプラインのさまざまなコンポーネントについて、取得、プロンプト、微調整への一般的なアプローチを含めて詳細に説明します。
最後に、このタスクのために作成された、公開されている英語のデータセットについて説明します。
要約(オリジナル)
The large and ever-increasing amount of data available on the Internet coupled with the laborious task of manual claim and fact verification has sparked the interest in the development of automated claim verification systems. Several deep learning and transformer-based models have been proposed for this task over the years. With the introduction of Large Language Models (LLMs) and their superior performance in several NLP tasks, we have seen a surge of LLM-based approaches to claim verification along with the use of novel methods such as Retrieval Augmented Generation (RAG). In this survey, we present a comprehensive account of recent claim verification frameworks using LLMs. We describe the different components of the claim verification pipeline used in these frameworks in detail including common approaches to retrieval, prompting, and fine-tuning. Finally, we describe publicly available English datasets created for this task.
arxiv情報
著者 | Alphaeus Dmonte,Roland Oruche,Marcos Zampieri,Prasad Calyam,Isabelle Augenstein |
発行日 | 2024-08-26 14:45:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google