FactCheXcker: Mitigating Measurement Hallucinations in Chest X-ray Report Generation Models

要約

医学的視覚言語モデルは、しばしば放射線レポートで正確な定量的測定を生成することに苦労し、臨床的信頼性を損なう幻覚につながります。
FactChexckerは、改良されたクエリコードアップデートパラダイムを活用することにより、放射線レポート測定を脱水するモジュール式フレームワークを紹介します。
具体的には、FactChexckerは、特殊なモジュールと大規模な言語モデルのコード生成機能を採用して、元のレポートに基づいて生成された測定クエリを解決します。
測定可能な所見を抽出した後、結果は更新されたレポートに組み込まれます。
MIMIC-CXRデータセットと11の医療報告書世代モデルを使用して、気管内チューブの配置でFactChexkkerを評価します。これは、レポート測定の平均78%を占めています。
私たちの結果は、FactChexckerが幻覚を大幅に減らし、測定精度を改善し、元のレポートの品質を維持することを示しています。
具体的には、FactChexckerは10/11モデルの性能を向上させ、平均絶対誤差で測定された測定幻覚を減らす際に135.0%の平均改善を達成します。
コードはhttps://github.com/rajpurkarlab/factchexckerで入手できます。

要約(オリジナル)

Medical vision-language models often struggle with generating accurate quantitative measurements in radiology reports, leading to hallucinations that undermine clinical reliability. We introduce FactCheXcker, a modular framework that de-hallucinates radiology report measurements by leveraging an improved query-code-update paradigm. Specifically, FactCheXcker employs specialized modules and the code generation capabilities of large language models to solve measurement queries generated based on the original report. After extracting measurable findings, the results are incorporated into an updated report. We evaluate FactCheXcker on endotracheal tube placement, which accounts for an average of 78% of report measurements, using the MIMIC-CXR dataset and 11 medical report-generation models. Our results show that FactCheXcker significantly reduces hallucinations, improves measurement precision, and maintains the quality of the original reports. Specifically, FactCheXcker improves the performance of 10/11 models and achieves an average improvement of 135.0% in reducing measurement hallucinations measured by mean absolute error. Code is available at https://github.com/rajpurkarlab/FactCheXcker.

arxiv情報

著者 Alice Heiman,Xiaoman Zhang,Emma Chen,Sung Eun Kim,Pranav Rajpurkar
発行日 2025-06-02 04:46:27+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク