要約
組織病理学や蛍光イメージングを含む顕微鏡画像に機械学習モデルを実世界で応用するためには、領域の汎化が重要である。病理組織検査におけるアーチファクトは、患者サンプルに内在する要因だけでなく、組織採取や検査室での処理に関連する要因の複雑な組み合わせによって発生する。蛍光イメージングでは、これらのアーチファクトは実験バッチ間のばらつきに起因する。このようなアーチファクトの複雑さと微妙さにより、データドメインの列挙は困難である。したがって、ドメイン識別子を必要とし、手作業で微調整を必要とするドメイン汎化の増強ベースの手法は、この設定では不十分である。この課題を克服するために、我々はContriMixを導入する。ContriMixは、顕微鏡画像の生物学的内容(「内容」)と技術的バリエーション(「属性」)を分離し、並べ替えることによって、合成画像を生成することを学習するドメイン汎化手法である。ContriMixは、ドメイン識別子や手作業による補強に依存せず、画像の入力特性について仮定しない。つの病理データセット(Camelyon17-WILDSと前立腺細胞分類データセット)と1つの蛍光顕微鏡データセット(RxRx1-WILDS)でContriMixの性能を評価した。ContriMixは全てのデータセットにおいて、現在の最先端手法を凌駕しており、ドメイン情報の入手が困難な実環境における顕微鏡画像解析への利用の動機付けとなっている。
要約(オリジナル)
Domain generalization is critical for real-world applications of machine learning models to microscopy images, including histopathology and fluorescence imaging. Artifacts in histopathology arise through a complex combination of factors relating to tissue collection and laboratory processing, as well as factors intrinsic to patient samples. In fluorescence imaging, these artifacts stem from variations across experimental batches. The complexity and subtlety of these artifacts make the enumeration of data domains intractable. Therefore, augmentation-based methods of domain generalization that require domain identifiers and manual fine-tuning are inadequate in this setting. To overcome this challenge, we introduce ContriMix, a domain generalization technique that learns to generate synthetic images by disentangling and permuting the biological content (‘content’) and technical variations (‘attributes’) in microscopy images. ContriMix does not rely on domain identifiers or handcrafted augmentations and makes no assumptions about the input characteristics of images. We assess the performance of ContriMix on two pathology datasets (Camelyon17-WILDS and a prostate cell classification dataset) and one fluorescence microscopy dataset (RxRx1-WILDS). ContriMix outperforms current state-of-the-art methods in all datasets, motivating its usage for microscopy image analysis in real-world settings where domain information is hard to come by.
arxiv情報
著者 | Tan H. Nguyen,Dinkar Juyal,Jin Li,Aaditya Prakash,Shima Nofallah,Chintan Shah,Sai Chowdary Gullapally,Michael Griffin,Anand Sampat,John Abel,Justin Lee,Amaro Taylor-Weiner |
発行日 | 2023-07-03 15:29:43+00:00 |
arxivサイト | arxiv_id(pdf) |