Rethinking Radiology Report Generation via Causal Inspired Counterfactual Augmentation


Radiology Report Generation (RRG) は、生物医学分野の視覚と言語の相互作用として注目を集めています。
大きな進歩にもかかわらず、RRG の特有の特性である疾患間の独立性が無視され、偏ったデータ分布によってもたらされる疾患の同時発生によってモデルが混乱し、不正確なレポートが生成されました。
つまり、ジョイント ビジョン カップリングと条件付き逐次カップリングです。
次に、バックドア パスに介入するための、プロトタイプベースの反事実サンプル合成 (P-CSS) と Magic-Cube のような反事実レポート再構成 (Cube) という 2 つの戦略を含む、新しいモデルに依存しない反事実拡張手法を提案しました。
したがって、RRG モデルの精度と汎用性が向上します。
広く使用されている MIMIC-CXR データセットに関する実験結果は、提案した方法の有効性を示しています。
さらに、一般化パフォーマンスが IU X 線データセットで評価され、これにより、私たちの研究が結果に対する異なる分布によって引き起こされる共起の影響を効果的に軽減できることが検証されます。


Radiology Report Generation (RRG) draws attention as a vision-and-language interaction of biomedical fields. Previous works inherited the ideology of traditional language generation tasks, aiming to generate paragraphs with high readability as reports. Despite significant progress, the independence between diseases-a specific property of RRG-was neglected, yielding the models being confused by the co-occurrence of diseases brought on by the biased data distribution, thus generating inaccurate reports. In this paper, to rethink this issue, we first model the causal effects between the variables from a causal perspective, through which we prove that the co-occurrence relationships between diseases on the biased distribution function as confounders, confusing the accuracy through two backdoor paths, i.e. the Joint Vision Coupling and the Conditional Sequential Coupling. Then, we proposed a novel model-agnostic counterfactual augmentation method that contains two strategies, i.e. the Prototype-based Counterfactual Sample Synthesis (P-CSS) and the Magic-Cube-like Counterfactual Report Reconstruction (Cube), to intervene the backdoor paths, thus enhancing the accuracy and generalization of RRG models. Experimental results on the widely used MIMIC-CXR dataset demonstrate the effectiveness of our proposed method. Additionally, a generalization performance is evaluated on IU X-Ray dataset, which verifies our work can effectively reduce the impact of co-occurrences caused by different distributions on the results.


著者 Xiao Song,Jiafan Liu,Yun Li,Yan Liu,Wenbin Lei,Ruxin Wang
発行日 2024-07-30 16:11:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, Google

カテゴリー: cs.CL, cs.CV, cs.MM パーマリンク