要約
領域の一般化は、組織病理学や蛍光イメージングなどの顕微鏡画像への機械学習モデルの現実世界の応用にとって重要です。
組織病理学におけるアーチファクトは、患者のサンプルに固有の要因だけでなく、組織収集や研究室での処理に関連する要因の複雑な組み合わせによって発生します。
蛍光イメージングでは、これらのアーティファクトは実験バッチ間の変動に起因します。
これらのアーティファクトの複雑さと繊細さにより、データ ドメインの列挙が困難になります。
したがって、ドメイン識別子と手動による微調整を必要とする拡張ベースのドメイン一般化方法は、この設定では不適切です。
この課題を克服するために、顕微鏡画像内の生物学的内容 (「コンテンツ」) と技術的バリエーション (「属性」) を解きほぐし、並べ替えることによって合成画像を生成することを学習するドメイン一般化手法である ContriMix を紹介します。
ContriMix は、ドメイン識別子や手作りの拡張に依存せず、画像の入力特性について何の仮定も行いません。
2 つの病理学データセット (Camelyon17-WILDS および前立腺細胞分類データセット) と 1 つの蛍光顕微鏡データセット (RxRx1-WILDS) に対する ContriMix のパフォーマンスを評価します。
ContriMix は、すべてのデータセットにおいて現在の最先端の手法を上回るパフォーマンスを示し、ドメイン情報の入手が困難な現実世界の環境での顕微鏡画像解析での使用を促進します。
要約(オリジナル)
Domain generalization is critical for real-world applications of machine learning models to microscopy images, including histopathology and fluorescence imaging. Artifacts in histopathology arise through a complex combination of factors relating to tissue collection and laboratory processing, as well as factors intrinsic to patient samples. In fluorescence imaging, these artifacts stem from variations across experimental batches. The complexity and subtlety of these artifacts make the enumeration of data domains intractable. Therefore, augmentation-based methods of domain generalization that require domain identifiers and manual fine-tuning are inadequate in this setting. To overcome this challenge, we introduce ContriMix, a domain generalization technique that learns to generate synthetic images by disentangling and permuting the biological content (‘content’) and technical variations (‘attributes’) in microscopy images. ContriMix does not rely on domain identifiers or handcrafted augmentations and makes no assumptions about the input characteristics of images. We assess the performance of ContriMix on two pathology datasets (Camelyon17-WILDS and a prostate cell classification dataset) and one fluorescence microscopy dataset (RxRx1-WILDS). ContriMix outperforms current state-of-the-art methods in all datasets, motivating its usage for microscopy image analysis in real-world settings where domain information is hard to come by.
arxiv情報
著者 | Tan H. Nguyen,Dinkar Juyal,Jin Li,Aaditya Prakash,Shima Nofallah,Chintan Shah,Sai Chowdary Gullapally,Michael Griffin,Anand Sampat,John Abel,Justin Lee,Amaro Taylor-Weiner |
発行日 | 2023-06-07 15:36:26+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google