Debiasing Cardiac Imaging with Controlled Latent Diffusion Models

要約

心臓磁気共鳴画像法に基づく疾患の診断と予後のためのディープラーニング ソリューションの進歩は、非常に不均衡で偏ったトレーニング データによって妨げられています。
この問題に対処するために、性別、年齢、BMI、健康状態などの機密属性に基づいて合成データを生成することで、データセットに固有の不均衡を軽減する方法を提案します。
当社では、ノイズ除去拡散確率モデルに基づく ControlNet を採用し、患者のメタデータから組み立てられたテキストと、大規模コホート研究、特に英国バイオバンクを使用したセグメンテーション マスクから導出された心臓形状を条件付けします。
確立された定量的指標を使用して、生成された画像のリアリズムを評価することにより、私たちの方法を評価します。
さらに、合成的に生成されたサンプルを通じて過小評価されたグループ内の不均衡を修正することにより、分類器のバイアスを軽減することを目的とした下流の分類タスクを実行します。
私たちの実験は、心不全を患っている若い患者や正常な BMI レベルを持つ個人の不足など、データセットの不均衡を軽減する上で提案されたアプローチの有効性を実証しています。
この研究は、医療分類タスクのための公正で一般化可能なモデルの開発に合成データを採用するための大きな一歩を表しています。
特に、リソースに制約のある環境内でのアプローチの実現可能性を強調するために、単一の消費者レベルの GPU を使用してすべての実験を実施しています。
私たちのコードは https://github.com/faildeny/debiasing-cardiac-mri で入手できます。

要約(オリジナル)

The progress in deep learning solutions for disease diagnosis and prognosis based on cardiac magnetic resonance imaging is hindered by highly imbalanced and biased training data. To address this issue, we propose a method to alleviate imbalances inherent in datasets through the generation of synthetic data based on sensitive attributes such as sex, age, body mass index, and health condition. We adopt ControlNet based on a denoising diffusion probabilistic model to condition on text assembled from patient metadata and cardiac geometry derived from segmentation masks using a large-cohort study, specifically, the UK Biobank. We assess our method by evaluating the realism of the generated images using established quantitative metrics. Furthermore, we conduct a downstream classification task aimed at debiasing a classifier by rectifying imbalances within underrepresented groups through synthetically generated samples. Our experiments demonstrate the effectiveness of the proposed approach in mitigating dataset imbalances, such as the scarcity of younger patients or individuals with normal BMI level suffering from heart failure. This work represents a major step towards the adoption of synthetic data for the development of fair and generalizable models for medical classification tasks. Notably, we conduct all our experiments using a single, consumer-level GPU to highlight the feasibility of our approach within resource-constrained environments. Our code is available at https://github.com/faildeny/debiasing-cardiac-mri.

arxiv情報

著者 Grzegorz Skorupko,Richard Osuala,Zuzanna Szafranowska,Kaisar Kushibar,Nay Aung,Steffen E Petersen,Karim Lekadir,Polyxeni Gkontra
発行日 2024-03-28 15:41:43+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク