要約
医用画像のセグメンテーションでは、意味的に類似したサンプルと異なるサンプルのペアを対比することによって視覚的表現の品質を向上させるための対比学習が主流です。
これは、グランド トゥルース ラベルにアクセスせずに、本当に異なる解剖学的特徴を持つネガティブ サンプルをサンプリングした場合、パフォーマンスが大幅に向上する可能性があるという観察によって可能になります。
ただし、実際には、これらのサンプルは類似した解剖学的領域に由来する可能性があり、モデルは少数の尾部クラスのサンプルを区別するのに苦労する可能性があり、その結果、尾部クラスが誤分類されやすくなり、通常はどちらもモデルの崩壊につながります。
この論文では、医用画像セグメンテーションのための階層化グループ理論を備えた半教師あり対比学習 (CL) フレームワークである ARCO を提案します。
特に、分散低減推定の概念を通じて ARCO を構築することを最初に提案し、特定の分散低減技術がラベルが非常に限られたピクセル/ボクセル レベルのセグメンテーション タスクで特に有益であることを示します。
さらに、これらのサンプリング手法が分散削減において普遍的であることを理論的に証明します。
最後に、異なるラベル設定を使用して、8 つのベンチマーク (5 つの 2D/3D 医療データセットと 3 つのセマンティック セグメンテーション データセット) でアプローチを実験的に検証しました。その結果、私たちの手法は一貫して最先端の半教師あり手法を上回りました。
さらに、これらのサンプリング手法を使用して CL フレームワークを強化し、以前の手法に比べて大幅な改善が得られることを実証します。
私たちは、このような安全性が重要な課題を達成するための現在の自己監視目標の限界を定量化することにより、私たちの研究が半教師あり医療画像セグメンテーションに向けた重要な一歩となると信じています。
要約(オリジナル)
For medical image segmentation, contrastive learning is the dominant practice to improve the quality of visual representations by contrasting semantically similar and dissimilar pairs of samples. This is enabled by the observation that without accessing ground truth labels, negative examples with truly dissimilar anatomical features, if sampled, can significantly improve the performance. In reality, however, these samples may come from similar anatomical regions and the models may struggle to distinguish the minority tail-class samples, making the tail classes more prone to misclassification, both of which typically lead to model collapse. In this paper, we propose ARCO, a semi-supervised contrastive learning (CL) framework with stratified group theory for medical image segmentation. In particular, we first propose building ARCO through the concept of variance-reduced estimation and show that certain variance-reduction techniques are particularly beneficial in pixel/voxel-level segmentation tasks with extremely limited labels. Furthermore, we theoretically prove these sampling techniques are universal in variance reduction. Finally, we experimentally validate our approaches on eight benchmarks, i.e., five 2D/3D medical and three semantic segmentation datasets, with different label settings, and our methods consistently outperform state-of-the-art semi-supervised methods. Additionally, we augment the CL frameworks with these sampling techniques and demonstrate significant gains over previous methods. We believe our work is an important step towards semi-supervised medical image segmentation by quantifying the limitation of current self-supervision objectives for accomplishing such challenging safety-critical tasks.
arxiv情報
著者 | Chenyu You,Weicheng Dai,Yifei Min,Fenglin Liu,David A. Clifton,S Kevin Zhou,Lawrence Hamilton Staib,James S Duncan |
発行日 | 2023-05-24 16:11:28+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google