Standardized CycleGAN training for unsupervised stain adaptation in invasive carcinoma classification for breast histopathology

要約

一般化は、計算病理学の主な課題の 1 つです。
トレーニング中に見られない医療センターからのデータで使用すると、スライド準備の不均一性とスキャナーの多様性により、モデルのパフォーマンスが低下します。
乳房浸潤癌パッチ分類で染色不変性を達成するために、教師なしの画像から画像への変換にcycleGANを使用した染色変換戦略を実装します。
3つのcycleGANベースのアプローチを、染色不変性戦略なしで取得されたベースライン分類モデルと比較します。
提案されたアプローチのうちの 2 つは、染色固有の分類モデルを構築するために、推論またはトレーニングで cycleGAN の翻訳を使用します。
最後の方法では、トレーニング中の染色データの増強にそれらを使用します。
これにより、染色不変の特徴を学習するように分類モデルが制約されます。
ベースライン指標は、参照染色でベースライン分類モデルをトレーニングおよびテストすることによって設定されます。
H&EおよびH&E&S染色のある3つの医療センターを使用してパフォーマンスを評価しました。
この研究でテストされたすべてのアプローチは、ターゲット染色のラベルを必要とせずにベースライン メトリックを改善します。
染色増強ベースのアプローチは、すべての染色で最良の結果をもたらしました。
このホワイト ペーパーでは、各方法の長所と短所を検討し、説明します。
ただし、高性能な cycleGANs モデルをトレーニングすること自体が課題です。
この作業では、新しい停止基準を設定することにより、cycleGAN トレーニングを最適化するための体系的な方法を紹介します。
この方法には、cycleGAN の結果を目視検査する必要がないという利点があり、事前定義された数のトレーニング エポックを使用する方法よりも優れていることが証明されます。
さらに、cycleGAN トレーニングに必要な最小限のデータ量についても調査します。

要約(オリジナル)

Generalization is one of the main challenges of computational pathology. Slide preparation heterogeneity and the diversity of scanners lead to poor model performance when used on data from medical centers not seen during training. In order to achieve stain invariance in breast invasive carcinoma patch classification, we implement a stain translation strategy using cycleGANs for unsupervised image-to-image translation. We compare three cycleGAN-based approaches to a baseline classification model obtained without any stain invariance strategy. Two of the proposed approaches use cycleGAN’s translations at inference or training in order to build stain-specific classification models. The last method uses them for stain data augmentation during training. This constrains the classification model to learn stain-invariant features. Baseline metrics are set by training and testing the baseline classification model on a reference stain. We assessed performances using three medical centers with H&E and H&E&S staining. Every approach tested in this study improves baseline metrics without needing labels on target stains. The stain augmentation-based approach produced the best results on every stain. Each method’s pros and cons are studied and discussed in this paper. However, training highly performing cycleGANs models in itself represents a challenge. In this work, we introduce a systematical method for optimizing cycleGAN training by setting a novel stopping criterion. This method has the benefit of not requiring any visual inspection of cycleGAN results and proves superiority to methods using a predefined number of training epochs. In addition, we also study the minimal amount of data required for cycleGAN training.

arxiv情報

著者 Nicolas Nerrienet,Rémy Peyret,Marie Sockeel,Stéphane Sockeel
発行日 2023-01-30 18:07:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク