要約
2つの画像セットが同じまたは異なる分布またはドメインに属するかどうかを判断することは、現代の医療画像分析と深い学習において重要なタスクです。
たとえば、画像生成モデルの出力品質を評価します。
現在、このタスクに使用されるメトリックは、セグメンテーションなどの下流タスクの(潜在的に偏った)選択に依存しているか、タスクに依存しない知覚メトリック(例えば、fr \ ‘echetインセプション距離/fid)を自然なイメージングから採用しています。
この目的のために、標準化された臨床的に意味のある、解釈可能な画像機能を利用する、医療画像に合わせた新しい知覚メトリック(FR \ ‘Echet Radiomic距離)を紹介します。
FRDは、ドメイン外(OOD)検出、画像間翻訳の評価(下流のタスクのパフォーマンスと解剖学的一貫性とリアリズムとより相関することにより)、および無条件画像生成の評価など、さまざまな医療イメージングアプリケーションの他の画像分布メトリックよりも優れていることを示しています。
さらに、FRDは、低いサンプルサイズでの安定性や計算効率、画像の腐敗や敵対的攻撃に対する感受性、特徴の解釈可能性、放射線科医認識の画質との相関などの追加の利点を提供します。
さらに、医療イメージングにおける画像類似性メトリックの多面的な評価のための広範なフレームワークを提示することにより、医療画像翻訳の生成モデルの最初の大規模な比較研究を含む、将来の研究を促進するためのアクセス可能なコードベースをリリースすることにより、文献の重要なギャップに対処します。
私たちの結果は、さまざまなデータセット、モダリティ、および下流タスクにまたがる徹底的な実験によってサポートされており、医療画像分析のためのFRDの幅広い可能性を強調しています。
要約(オリジナル)
Determining whether two sets of images belong to the same or different distributions or domains is a crucial task in modern medical image analysis and deep learning; for example, to evaluate the output quality of image generative models. Currently, metrics used for this task either rely on the (potentially biased) choice of some downstream task, such as segmentation, or adopt task-independent perceptual metrics (e.g., Fr\’echet Inception Distance/FID) from natural imaging, which we show insufficiently capture anatomical features. To this end, we introduce a new perceptual metric tailored for medical images, FRD (Fr\’echet Radiomic Distance), which utilizes standardized, clinically meaningful, and interpretable image features. We show that FRD is superior to other image distribution metrics for a range of medical imaging applications, including out-of-domain (OOD) detection, the evaluation of image-to-image translation (by correlating more with downstream task performance as well as anatomical consistency and realism), and the evaluation of unconditional image generation. Moreover, FRD offers additional benefits such as stability and computational efficiency at low sample sizes, sensitivity to image corruptions and adversarial attacks, feature interpretability, and correlation with radiologist-perceived image quality. Additionally, we address key gaps in the literature by presenting an extensive framework for the multifaceted evaluation of image similarity metrics in medical imaging — including the first large-scale comparative study of generative models for medical image translation — and release an accessible codebase to facilitate future research. Our results are supported by thorough experiments spanning a variety of datasets, modalities, and downstream tasks, highlighting the broad potential of FRD for medical image analysis.
arxiv情報
著者 | Nicholas Konz,Richard Osuala,Preeti Verma,Yuwen Chen,Hanxue Gu,Haoyu Dong,Yaqian Chen,Andrew Marshall,Lidia Garrucho,Kaisar Kushibar,Daniel M. Lang,Gene S. Kim,Lars J. Grimm,John M. Lewin,James S. Duncan,Julia A. Schnabel,Oliver Diaz,Karim Lekadir,Maciej A. Mazurowski |
発行日 | 2025-06-06 16:36:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google