要約
医用画像分析用の深層学習モデルの汎化パフォーマンスは、データ収集、デバイス設定、患者集団などのさまざまなデバイスで収集された画像では低下することがよくあります。
新しい画像に対する汎化能力をより深く理解することは、ディープラーニングにおける臨床医の信頼性にとって非常に重要です。
最近、汎化限界と複雑さの尺度を確立することに多大な研究努力が向けられていますが、それでも、予測された汎化パフォーマンスと実際の汎化パフォーマンスの間には大きな差異が存在することがよくあります。
同様に、関連する大規模な実証研究は主に汎用画像データセットによる検証に基づいています。
この論文では、25 の複雑さの尺度と、乳房超音波画像の教師あり深層学習分類器の汎化能力との相関関係を調査する実証研究を紹介します。
結果は、PAC ベイズ平坦度ベースおよびパスノルムベースの測定が、モデルとデータの組み合わせに対して最も一貫した説明を生み出すことを示しています。
また、乳房画像に対するマルチタスク分類およびセグメンテーション手法の使用についても調査し、そのような学習手法が暗黙的な正則化装置として機能し、一般化の向上に役立つことを報告します。
要約(オリジナル)
The generalization performance of deep learning models for medical image analysis often decreases on images collected with different devices for data acquisition, device settings, or patient population. A better understanding of the generalization capacity on new images is crucial for clinicians’ trustworthiness in deep learning. Although significant research efforts have been recently directed toward establishing generalization bounds and complexity measures, still, there is often a significant discrepancy between the predicted and actual generalization performance. As well, related large empirical studies have been primarily based on validation with general-purpose image datasets. This paper presents an empirical study that investigates the correlation between 25 complexity measures and the generalization abilities of supervised deep learning classifiers for breast ultrasound images. The results indicate that PAC-Bayes flatness-based and path norm-based measures produce the most consistent explanation for the combination of models and data. We also investigate the use of multi-task classification and segmentation approach for breast images, and report that such learning approach acts as an implicit regularizer and is conducive toward improved generalization.
arxiv情報
著者 | Aleksandar Vakanski,Min Xian |
発行日 | 2023-07-19 16:19:53+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google