Quantifying the Impact of Population Shift Across Age and Sex for Abdominal Organ Segmentation

要約

深層学習ベースの医療画像セグメンテーションは、過去 10 年間で大きな進歩を遂げましたが、臨床現場への移行はまだ比較的わずかです。
主な障壁の 1 つは、ドメインの一般化という課題です。これには、広範囲に分布する画像データにわたって高いパフォーマンスを維持するためにセグメンテーション モデルが必要です。
この課題は、取得条件や患者の特徴など、医療画像の外観の多様性に寄与する多くの要因によってさらに増幅されます。
年齢や性別などの患者特性の変化がセグメンテーション パフォーマンスに及ぼす影響は、セグメンテーション モデルの公平性を確保するために重要であるにもかかわらず、特に腹部臓器については比較的研究が進んでいません。
我々は、2 つの大規模な公開データセットを活用して、腹部 CT 画像セグメンテーションに対する年齢と性別に関する人口移動の影響を決定する最初の研究を実行し、その影響を定量化するための新しい指標を導入します。
人口シフトは、腹部臓器セグメンテーションのデータセット間シフトと同様の規模の課題であり、その影響は非対称でデータセットに依存していることがわかりました。
既知の患者の特徴に関するデータセットの多様性は、画像特徴に関するデータセットの多様性と必ずしも同等ではないと結論付けています。
これは、適切な一般化と公平性を確保するための単純な母集団マッチングでは不十分である可能性があることを意味しており、公平性の研究は、臓器形態などのパフォーマンス関連の特性の観点から医用画像データセットの多様性をより深く理解し、定量化することに向けられるべきであることを推奨します。

要約(オリジナル)

Deep learning-based medical image segmentation has seen tremendous progress over the last decade, but there is still relatively little transfer into clinical practice. One of the main barriers is the challenge of domain generalisation, which requires segmentation models to maintain high performance across a wide distribution of image data. This challenge is amplified by the many factors that contribute to the diverse appearance of medical images, such as acquisition conditions and patient characteristics. The impact of shifting patient characteristics such as age and sex on segmentation performance remains relatively under-studied, especially for abdominal organs, despite that this is crucial for ensuring the fairness of the segmentation model. We perform the first study to determine the impact of population shift with respect to age and sex on abdominal CT image segmentation, by leveraging two large public datasets, and introduce a novel metric to quantify the impact. We find that population shift is a challenge similar in magnitude to cross-dataset shift for abdominal organ segmentation, and that the effect is asymmetric and dataset-dependent. We conclude that dataset diversity in terms of known patient characteristics is not necessarily equivalent to dataset diversity in terms of image features. This implies that simple population matching to ensure good generalisation and fairness may be insufficient, and we recommend that fairness research should be directed towards better understanding and quantifying medical image dataset diversity in terms of performance-relevant characteristics such as organ morphology.

arxiv情報

著者 Kate Čevora,Ben Glocker,Wenjia Bai
発行日 2024-08-08 17:28:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク