要約
医療画像分析を使用した自動疾患診断は深層学習に依存しており、教師ありモデルのトレーニングには大規模なラベル付きデータセットが必要になることがよくあります。
急性骨髄性白血病 (AML) のような疾患は、単一細胞レベルでのアノテーションが不足しており、コストがかかるため、課題が生じています。
複数インスタンス学習 (MIL) は、弱くラベル付けされたシナリオに対処しますが、通常はラベル付けされたデータでトレーニングされた強力なエンコーダーを必要とします。
この研究では、血液塗抹標本からの MIL ベースの AML サブタイプ分類のための事前トレーニング アプローチとして自己教師あり学習 (SSL) を検討し、エンコーダー トレーニング中のラベル付きデータの必要性を排除します。
私たちは、SimCLR、SwAV、DINO という 3 つの最先端の SSL メソッドを調査し、教師あり事前トレーニングとそのパフォーマンスを比較します。
私たちの調査結果は、SSL で事前トレーニングされたエンコーダーが同等のパフォーマンスを達成することを示しており、MIL における SSL の可能性を示しています。
この画期的な進歩により、費用対効果とデータ効率の高いソリューションが提供され、AI ベースの疾患診断の分野が推進されます。
要約(オリジナル)
Automated disease diagnosis using medical image analysis relies on deep learning, often requiring large labeled datasets for supervised model training. Diseases like Acute Myeloid Leukemia (AML) pose challenges due to scarce and costly annotations on a single-cell level. Multiple Instance Learning (MIL) addresses weakly labeled scenarios but necessitates powerful encoders typically trained with labeled data. In this study, we explore Self-Supervised Learning (SSL) as a pre-training approach for MIL-based AML subtype classification from blood smears, removing the need for labeled data during encoder training. We investigate the three state-of-the-art SSL methods SimCLR, SwAV, and DINO, and compare their performance against supervised pre-training. Our findings show that SSL-pretrained encoders achieve comparable performance, showcasing the potential of SSL in MIL. This breakthrough offers a cost-effective and data-efficient solution, propelling the field of AI-based disease diagnosis.
arxiv情報
著者 | Salome Kazeminia,Max Joosten,Dragan Bosnacki,Carsten Marr |
発行日 | 2024-03-08 15:16:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google