要約
特に、皮膚鏡による皮膚がん分類のような安全性が重要な臨床タスクでは、これまで見たことのない領域の画像に汎化する畳み込みニューラルネットワークの能力が限られていることが大きな制約となっている。CNNベースのアプリケーションを臨床に応用するためには、ドメインの変化に適応できることが不可欠である。このような新たな状況は、異なる画像取得システムの使用や照明条件の変化によって生じる可能性がある。ダーモスコピーでは、患者の年齢の変化や、まれな病変部位の発生(手のひらなど)によってもシフトが発生する。これらはほとんどのトレーニングデータセットでは顕著に表れないため、性能の低下につながる可能性がある。実際の臨床現場における分類モデルの一般性を検証するためには、このような領域シフトを模倣したデータにアクセスすることが極めて重要である。我々の知る限り、このようなドメインシフトが適切に記述され定量化された皮膚鏡画像データセットは存在しない。そこで我々は、ISICアーカイブから公開されている画像を、そのメタデータ(撮影位置、病変の位置、患者の年齢など)に基づいてグループ化し、意味のあるドメインを生成した。これらのドメインが実際に別個のものであることを検証するため、複数の定量化手段を用いてドメインシフトの有無と強度を推定した。さらに、教師なし領域適応技術を使用した場合と使用しなかった場合の、これらの領域のパフォーマンスを分析した。その結果、グループ化されたドメインのほとんどにおいて、ドメインシフトが実際に存在することが確認された。この結果から、これらのデータセットは皮膚鏡皮膚がん分類法の汎化能力をテストするのに有用であると考えられる。
要約(オリジナル)
The limited ability of Convolutional Neural Networks to generalize to images from previously unseen domains is a major limitation, in particular, for safety-critical clinical tasks such as dermoscopic skin cancer classification. In order to translate CNN-based applications into the clinic, it is essential that they are able to adapt to domain shifts. Such new conditions can arise through the use of different image acquisition systems or varying lighting conditions. In dermoscopy, shifts can also occur as a change in patient age or occurence of rare lesion localizations (e.g. palms). These are not prominently represented in most training datasets and can therefore lead to a decrease in performance. In order to verify the generalizability of classification models in real world clinical settings it is crucial to have access to data which mimics such domain shifts. To our knowledge no dermoscopic image dataset exists where such domain shifts are properly described and quantified. We therefore grouped publicly available images from ISIC archive based on their metadata (e.g. acquisition location, lesion localization, patient age) to generate meaningful domains. To verify that these domains are in fact distinct, we used multiple quantification measures to estimate the presence and intensity of domain shifts. Additionally, we analyzed the performance on these domains with and without an unsupervised domain adaptation technique. We observed that in most of our grouped domains, domain shifts in fact exist. Based on our results, we believe these datasets to be helpful for testing the generalization capabilities of dermoscopic skin cancer classifiers.
arxiv情報
著者 | Katharina Fogelberg,Sireesha Chamarthi,Roman C. Maron,Julia Niebling,Titus J. Brinker |
発行日 | 2023-07-03 08:40:03+00:00 |
arxivサイト | arxiv_id(pdf) |