RELICT: A Replica Detection Framework for Medical Image Generation

要約

深い学習モデルの一般化を強化し、改善するための合成医療データの可能性にもかかわらず、生成モデルの記憶は、敏感な患者情報の意図しない漏れにつながり、モデルのユーティリティを制限する可能性があります。
したがって、医療ドメインで生成モデルを記憶することの使用は、患者のプライバシーを危険にさらす可能性があります。
合成医療画像データセットで、レプリカ、つまりトレーニングデータのほぼ同一のコピーを識別するためのフレームワークを提案します。
医療画像モデルのレプリカ検出(リリクト)フレームワークは、3つの補完的なアプローチを使用して画像の類似性を評価します:(1)ボクセルレベル分析、(2)前処理された医療基礎モデルによる特徴レベル分析、および(3)セグメンテーションレベル分析

2つの臨床的に関連する3D生成モデリングユースケースが調査されました。脳内出血(n = 774)とウィリスのサークルの血管造影時間(n = 1,782)を備えた非コントラストヘッドCT。
エキスパートの視覚スコアリングは、レプリカの存在を評価するための参照標準として使用されました。
バランスの取れた精度を最適なしきい値で報告して、レプリカ分類パフォーマンスを評価します。
参照視覚評価では、それぞれNCCTおよびTOF-MRAユースケースのレプリカとして生成された画像のうち45と5つのうち45と5が識別されました。
NCCTユースケースに最適なしきい値が選択された場合、画像レベルと機能レベルの測定完全に分類されたレプリカが1のバランスの取れた精度が1の場合です。
TOF-MRAケースのレプリカの完全な分類は、どのしきい値でも不可能であり、セグメンテーションレベルの分析は0.79のバランスの取れた精度を達成しました。
レプリカ検出は、医療イメージングにおける生成モデルの開発のための重要ではあるが無視された検証ステップです。
提案されたリリクトフレームワークは、レプリカ検出のための標準化された使いやすいツールを提供し、責任ある倫理的な医療イメージの合成を促進することを目的としています。

要約(オリジナル)

Despite the potential of synthetic medical data for augmenting and improving the generalizability of deep learning models, memorization in generative models can lead to unintended leakage of sensitive patient information and limit model utility. Thus, the use of memorizing generative models in the medical domain can jeopardize patient privacy. We propose a framework for identifying replicas, i.e. nearly identical copies of the training data, in synthetic medical image datasets. Our REpLIca deteCTion (RELICT) framework for medical image generative models evaluates image similarity using three complementary approaches: (1) voxel-level analysis, (2) feature-level analysis by a pretrained medical foundation model, and (3) segmentation-level analysis. Two clinically relevant 3D generative modelling use cases were investigated: non-contrast head CT with intracerebral hemorrhage (N=774) and time-of-flight MR angiography of the Circle of Willis (N=1,782). Expert visual scoring was used as the reference standard to assess the presence of replicas. We report the balanced accuracy at the optimal threshold to assess replica classification performance. The reference visual rating identified 45 of 50 and 5 of 50 generated images as replicas for the NCCT and TOF-MRA use cases, respectively. Image-level and feature-level measures perfectly classified replicas with a balanced accuracy of 1 when an optimal threshold was selected for the NCCT use case. A perfect classification of replicas for the TOF-MRA case was not possible at any threshold, with the segmentation-level analysis achieving a balanced accuracy of 0.79. Replica detection is a crucial but neglected validation step for the development of generative models in medical imaging. The proposed RELICT framework provides a standardized, easy-to-use tool for replica detection and aims to facilitate responsible and ethical medical image synthesis.

arxiv情報

著者 Orhun Utku Aydin,Alexander Koch,Adam Hilbert,Jana Rieger,Felix Lohrke,Fujimaro Ishida,Satoru Tanioka,Dietmar Frey
発行日 2025-02-24 17:37:19+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク