要約
組織病理学や蛍光イメージングを含む顕微鏡画像に機械学習を実世界で応用するためには、領域の汎化が重要である。これらのモダリティにおけるアーチファクトは、患者サンプルに内在する要因だけでなく、組織採取や検査室での処理に関連する要因の複雑な組み合わせによって発生する。蛍光イメージングでは、これらのアーチファクトは実験バッチ間のばらつきに起因する。このようなアーチファクトの複雑さと微妙さにより、データドメインの列挙は困難である。したがって、ドメイン識別子を必要とし、手作業で微調整を必要とするドメイン汎化の増強ベースの手法は、この設定では不十分である。この課題を克服するために、我々はContriMixを導入する。ContriMixは、顕微鏡画像の生物学的内容(「内容」)と技術的バリエーション(「属性」)を分離し、並べ替えることによって、合成画像を生成することを学習するドメイン汎化手法である。ContriMixは、ドメイン識別子や手作業による補強に依存せず、画像の入力特性について仮定しない。ContriMixの性能を、パッチ分類と全スライド画像のラベル予測タスクをそれぞれ扱う2つの病理学データセット(Camelyon17-WILDSとRCC subtyping)と、1つの蛍光顕微鏡データセット(RxRx1-WILDS)で評価した。ContriMixは、学習時やテスト時にドメイン識別子にアクセスすることなく、これら全てのデータセットにおいて、現在の最先端手法と同等かそれ以上の性能を示し、ドメイン情報の入手が困難な実環境における顕微鏡画像解析への利用を動機付ける。ContriMixのコードはhttps://gitlab.com/huutan86/contrimix。
要約(オリジナル)
Domain generalization is critical for real-world applications of machine learning to microscopy images, including histopathology and fluorescence imaging. Artifacts in these modalities arise through a complex combination of factors relating to tissue collection and laboratory processing, as well as factors intrinsic to patient samples. In fluorescence imaging, these artifacts stem from variations across experimental batches. The complexity and subtlety of these artifacts make the enumeration of data domains intractable. Therefore, augmentation-based methods of domain generalization that require domain identifiers and manual fine-tuning are inadequate in this setting. To overcome this challenge, we introduce ContriMix, a domain generalization technique that learns to generate synthetic images by disentangling and permuting the biological content (‘content’) and technical variations (‘attributes’) in microscopy images. ContriMix does not rely on domain identifiers or handcrafted augmentations and makes no assumptions about the input characteristics of images. We assess the performance of ContriMix on two pathology datasets dealing with patch classification and Whole Slide Image label prediction tasks respectively (Camelyon17-WILDS and RCC subtyping), and one fluorescence microscopy dataset (RxRx1-WILDS). Without any access to domain identifiers at train or test time, ContriMix performs similar or better than current state-of-the-art methods in all these datasets, motivating its usage for microscopy image analysis in real-world settings where domain information is hard to come by. The code for ContriMix can be found at https://gitlab.com/huutan86/contrimix
arxiv情報
著者 | Tan H. Nguyen,Dinkar Juyal,Jin Li,Aaditya Prakash,Shima Nofallah,Chintan Shah,Sai Chowdary Gullapally,Limin Yu,Michael Griffin,Anand Sampat,John Abel,Justin Lee,Amaro Taylor-Weiner |
発行日 | 2023-12-04 18:42:25+00:00 |
arxivサイト | arxiv_id(pdf) |