要約
多様体仮説は深層学習の成功の背後にある中核的なメカニズムであるため、画像データの本質的な多様体構造を理解することは、ニューラルネットワークがデータからどのように学習するかを研究する上で中心的な役割を担っている。固有データセット多様体とその学習困難性との関係は、最近、自然画像という共通のドメインについて研究され始めているが、放射線画像についてはそのような研究はほとんど試みられていない。我々はここでこれに取り組む。まず、放射線画像と自然画像の固有多様体次元を比較する。また、固有次元と汎化能力との関係を様々なデータセットで調査する。その結果、一般に自然画像のデータセットは放射線画像よりも固有次元数が多いことがわかった。しかし、汎化能力と固有次元数の関係は医用画像でより強く、これは放射線画像がより学習が困難な固有特徴を持つためと説明できる。これらの結果は、機械学習研究で一般的な自然画像データセットよりも、放射線画像の方が深層学習の適用が困難であるという直感に、より原理的な裏付けを与えるものです。我々は、自然画像用に開発されたモデルを放射線画像領域に直接適用するのではなく、この領域特有の特性に合わせたアーキテクチャとアルゴリズムの開発に、より注意を払うべきだと考えています。本論文で示した研究は、これらの特徴や自然画像との違いを示すものであり、この方向への重要な第一歩となるものです。
要約(オリジナル)
The manifold hypothesis is a core mechanism behind the success of deep learning, so understanding the intrinsic manifold structure of image data is central to studying how neural networks learn from the data. Intrinsic dataset manifolds and their relationship to learning difficulty have recently begun to be studied for the common domain of natural images, but little such research has been attempted for radiological images. We address this here. First, we compare the intrinsic manifold dimensionality of radiological and natural images. We also investigate the relationship between intrinsic dimensionality and generalization ability over a wide range of datasets. Our analysis shows that natural image datasets generally have a higher number of intrinsic dimensions than radiological images. However, the relationship between generalization ability and intrinsic dimensionality is much stronger for medical images, which could be explained as radiological images having intrinsic features that are more difficult to learn. These results give a more principled underpinning for the intuition that radiological images can be more challenging to apply deep learning to than natural image datasets common to machine learning research. We believe rather than directly applying models developed for natural images to the radiological imaging domain, more care should be taken to developing architectures and algorithms that are more tailored to the specific characteristics of this domain. The research shown in our paper, demonstrating these characteristics and the differences from natural images, is an important first step in this direction.
arxiv情報
| 著者 | Nicholas Konz,Hanxue Gu,Haoyu Dong,Maciej A. Mazurowski |
| 発行日 | 2022-07-06 16:33:07+00:00 |
| arxivサイト | arxiv_id(pdf) |