ALFA — Leveraging All Levels of Feature Abstraction for Enhancing the Generalization of Histopathology Image Classification Across Unseen Hospitals

要約

私たちは、観察されていない病院に対する画像分類の一般化可能性の強化を目的として、あらゆるレベルの特徴抽象化を活用する徹底的な方法論を提案します。
私たちのアプローチには、口実タスクとして機能する組織病理学シナリオにおける一般的な分布の変化を伴う拡張ベースの自己監視が組み込まれています。
これにより、トレーニング ラベルに依存せずにトレーニング画像から不変特徴を導き出すことができるため、さまざまな抽象化レベルをカバーできます。
次の抽象化レベルに進むと、ドメイン調整モジュールを採用して、さまざまな研修病院にわたる不変特徴のさらなる抽出を容易にします。
参加病院の高度に特殊な特徴を表すために、エンコーダーは診断ラベルとは独立して病院ラベルを分類するようにトレーニングされています。
これらの各エンコーダからの特徴は、冗長性を最小限に抑え、特徴を分離するためにその後解きほぐされます。
この表現は広範囲のセマンティック情報に及び、異なる分布からの目に見えない画像に対する堅牢性の向上を実証するモデルの開発を可能にします。
PACS データセット (ドメイン一般化ベンチマーク)、組織病理学固有のジッターを MHIST データセット (さまざまな分布シフトを持つ異なるドメインを定義) に適用して作成された合成データセット、および TCGA の 4 つの画像リポジトリから派生した腎細胞癌データセットからの実験結果
、これらは集合的に、私たちが提案するモデルがさまざまなレベルの画像粒度の管理に熟達していることを示しています。
したがって、配布されていない新しい病院画像に直面した場合の一般化可能性が向上しています。

要約(オリジナル)

We propose an exhaustive methodology that leverages all levels of feature abstraction, targeting an enhancement in the generalizability of image classification to unobserved hospitals. Our approach incorporates augmentation-based self-supervision with common distribution shifts in histopathology scenarios serving as the pretext task. This enables us to derive invariant features from training images without relying on training labels, thereby covering different abstraction levels. Moving onto the subsequent abstraction level, we employ a domain alignment module to facilitate further extraction of invariant features across varying training hospitals. To represent the highly specific features of participating hospitals, an encoder is trained to classify hospital labels, independent of their diagnostic labels. The features from each of these encoders are subsequently disentangled to minimize redundancy and segregate the features. This representation, which spans a broad spectrum of semantic information, enables the development of a model demonstrating increased robustness to unseen images from disparate distributions. Experimental results from the PACS dataset (a domain generalization benchmark), a synthetic dataset created by applying histopathology-specific jitters to the MHIST dataset (defining different domains with varied distribution shifts), and a Renal Cell Carcinoma dataset derived from four image repositories from TCGA, collectively indicate that our proposed model is adept at managing varying levels of image granularity. Thus, it shows improved generalizability when faced with new, out-of-distribution hospital images.

arxiv情報

著者 Milad Sikaroudi,Maryam Hosseini,Shahryar Rahnamayan,H. R. Tizhoosh
発行日 2023-08-09 16:21:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク