要約
胸部異常の検出と分類において、性能の良い深層学習ベースのアルゴリズムを開発するためには、大規模な胸部X線データセットが利用可能であることが必要である。しかし、胸部X線写真の生体識別情報は、患者の再識別のリスクのために、研究目的のためにこのようなデータの一般共有を妨げている。この問題を解決するために、合成データ生成は医療画像を匿名化するためのソリューションとなる。本研究では,潜在拡散モデルを用いて,高品質なクラス条件付き画像からなる匿名化された胸部X線画像データセットの合成を行う.また,画像生成の過程で生体情報の非移転を保証するために,プライバシーを向上させるサンプリング戦略を提案する.生成された画像の品質と排他的学習データとしての利用可能性を胸部異常分類課題において評価する.実際の分類器と比較して、受信者動作特性曲線下面積で3.5%の性能差しかなく、競争力のある結果を得ることができた。
要約(オリジナル)
The availability of large-scale chest X-ray datasets is a requirement for developing well-performing deep learning-based algorithms in thoracic abnormality detection and classification. However, biometric identifiers in chest radiographs hinder the public sharing of such data for research purposes due to the risk of patient re-identification. To counteract this issue, synthetic data generation offers a solution for anonymizing medical images. This work employs a latent diffusion model to synthesize an anonymous chest X-ray dataset of high-quality class-conditional images. We propose a privacy-enhancing sampling strategy to ensure the non-transference of biometric information during the image generation process. The quality of the generated images and the feasibility of serving as exclusive training data are evaluated on a thoracic abnormality classification task. Compared to a real classifier, we achieve competitive results with a performance gap of only 3.5% in the area under the receiver operating characteristic curve.
arxiv情報
著者 | Kai Packhäuser,Lukas Folle,Florian Thamm,Andreas Maier |
発行日 | 2022-11-04 15:09:31+00:00 |
arxivサイト | arxiv_id(pdf) |