HealthFC: A Dataset of Health Claims for Evidence-Based Medical Fact-Checking

要約

デジタル時代では、インターネットで健康関連のアドバイスを求めることが一般的になっています。
オンラインで見つかった医療上の主張の信頼性を判断し、この情報の適切な証拠を見つけることはますます困難になっています。
ファクトチェックは、信頼できる知識源からの証拠を使用して事実の主張の真実性を評価するアプローチとして登場しました。
このタスクの自動化を進めるために、この論文では、医療専門家によって真実性がラベル付けされ、適切な臨床研究の証拠に裏付けられた 750 件の健康関連主張の新しいデータセットを紹介します。
データセットの分析を提供し、その特徴と課題を明らかにします。
このデータセットは、証拠の検索、真実性の予測、説明の生成など、自動化されたファクトチェックに関連する機械学習タスクに使用できます。
この目的のために、さまざまなアプローチに基づいてベースライン モデルを提供し、そのパフォーマンスを検証し、その結果について議論します。

要約(オリジナル)

Seeking health-related advice on the internet has become a common practice in the digital era. Determining the trustworthiness of medical claims found online and finding appropriate evidence for this information is increasingly challenging. Fact-checking has emerged as an approach to assess the veracity of factual claims using evidence from credible knowledge sources. To help advance the automation of this task, in this paper, we introduce a novel dataset of 750 health-related claims, labeled for veracity by medical experts and backed with evidence from appropriate clinical studies. We provide an analysis of the dataset, highlighting its characteristics and challenges. The dataset can be used for Machine Learning tasks related to automated fact-checking such as evidence retrieval, veracity prediction, and explanation generation. For this purpose, we provide baseline models based on different approaches, examine their performance, and discuss the findings.

arxiv情報

著者 Juraj Vladika,Phillip Schneider,Florian Matthes
発行日 2023-09-15 16:05:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク