Domain shifts in dermoscopic skin cancer datasets: Evaluation of essential limitations for clinical translation



– コンボリューションニューラルネットワークの限定された汎化能力は、特に安全性の高いクリニカルタスクである皮膚癌の診断にとって重要な制限である。
– CNNベースのアプリケーションをクリニックに翻訳するためには、ドメインシフトに適応できることが重要である。新しい条件は、異なる画像取得システムや照明条件の使用により生じる可能性がある。
– 皮膚学においては、年齢の変化やまれな病変の局在(例:手掌)など、シフトが起こる可能性がある。これらは、多くのトレーニングデータセットに目立って表れていないため、パフォーマンスの低下につながる可能性がある。
– 実際のクリニカル環境における分類モデルの汎用性を検証するためには、このようなドメインシフトを模倣するデータにアクセスすることが重要である。
– この研究では、メタデータに基づいてISICアーカイブから公開されている画像をグループ化し、有意義なドメインを生成した。さらに、複数の定量化措置を使用してドメインシフトの存在と強度を評価した。
– 加えて、教師なしのドメイン適応技術を用いてこれらのドメインでのパフォーマンスを分析した。
– 多くのグループ化されたドメインにおいて、ドメインシフトが実際に存在することを観察した。
– 従って、これらのデータセットは、皮膚癌診断の汎用性能力をテストするために役立つと考えている。


The limited ability of Convolutional Neural Networks to generalize to images from previously unseen domains is a major limitation, in particular, for safety-critical clinical tasks such as dermoscopic skin cancer classification. In order to translate CNN-based applications into the clinic, it is essential that they are able to adapt to domain shifts. Such new conditions can arise through the use of different image acquisition systems or varying lighting conditions. In dermoscopy, shifts can also occur as a change in patient age or occurence of rare lesion localizations (e.g. palms). These are not prominently represented in most training datasets and can therefore lead to a decrease in performance. In order to verify the generalizability of classification models in real world clinical settings it is crucial to have access to data which mimics such domain shifts. To our knowledge no dermoscopic image dataset exists where such domain shifts are properly described and quantified. We therefore grouped publicly available images from ISIC archive based on their metadata (e.g. acquisition location, lesion localization, patient age) to generate meaningful domains. To verify that these domains are in fact distinct, we used multiple quantification measures to estimate the presence and intensity of domain shifts. Additionally, we analyzed the performance on these domains with and without an unsupervised domain adaptation technique. We observed that in most of our grouped domains, domain shifts in fact exist. Based on our results, we believe these datasets to be helpful for testing the generalization capabilities of dermoscopic skin cancer classifiers.


著者 Katharina Fogelberg,Sireesha Chamarthi,Roman C. Maron,Julia Niebling,Titus J. Brinker
発行日 2023-04-14 07:38:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV パーマリンク