Semi-Supervised Disease Classification based on Limited Medical Image Data

要約

近年、ラベルのない肯定的な例からの学習 (PU 学習) の分野、特に画像およびテキストの分類タスクの進歩において、大きな進歩が見られました。
しかし、PU 学習を半教師あり疾患分類に適用することは、主にラベル付き医用画像の利用が限られているため、依然として大きな課題となっています。
医療画像支援診断アルゴリズムの領域では、理論的および実際的な障害が数多く存在します。
医用画像支援診断のための PU 学習に関する研究は、専門家が画像の分類に費やす時間を削減することを目的としているため、非常に重要です。
自然画像とは異なり、医療画像は通常、注釈付きデータが不足している一方で、ラベルのないケースが多数存在します。
これらの課題に対処するために、この論文では、古いダイバージェンスに触発された新しい生成モデルを紹介します。このモデルは、ポジティブでラベルのない医療画像データを使用した半教師あり疾患分類用に特別に設計されています。
この論文では、この問題の包括的な定式化を提示し、厳密な数学的分析を通じてその理論的な実現可能性を確立します。
私たちが提案したアプローチの有効性を評価するために、PU の医学学習で一般的に使用される 5 つのベンチマーク データセット、BreastMNIST、PneumoniaMNIST、BloodMNIST、OCTMNIST、および AMD に対して広範な実験を実施しました。
実験結果は、KL 発散に基づく既存のアプローチに対する本手法の優位性を明確に示しています。
特に、私たちのアプローチは、5 つの疾患分類ベンチマークすべてにおいて最先端のパフォーマンスを達成しています。
限られたラベル付きデータによって課される制限に対処し、ラベルなしの医療画像の未開発の可能性を活用することにより、私たちの新しい生成モデルは、医療画像解析の分野における半教師あり疾患分類を強化するための有望な方向性を示します。

要約(オリジナル)

In recent years, significant progress has been made in the field of learning from positive and unlabeled examples (PU learning), particularly in the context of advancing image and text classification tasks. However, applying PU learning to semi-supervised disease classification remains a formidable challenge, primarily due to the limited availability of labeled medical images. In the realm of medical image-aided diagnosis algorithms, numerous theoretical and practical obstacles persist. The research on PU learning for medical image-assisted diagnosis holds substantial importance, as it aims to reduce the time spent by professional experts in classifying images. Unlike natural images, medical images are typically accompanied by a scarcity of annotated data, while an abundance of unlabeled cases exists. Addressing these challenges, this paper introduces a novel generative model inspired by H\’older divergence, specifically designed for semi-supervised disease classification using positive and unlabeled medical image data. In this paper, we present a comprehensive formulation of the problem and establish its theoretical feasibility through rigorous mathematical analysis. To evaluate the effectiveness of our proposed approach, we conduct extensive experiments on five benchmark datasets commonly used in PU medical learning: BreastMNIST, PneumoniaMNIST, BloodMNIST, OCTMNIST, and AMD. The experimental results clearly demonstrate the superiority of our method over existing approaches based on KL divergence. Notably, our approach achieves state-of-the-art performance on all five disease classification benchmarks. By addressing the limitations imposed by limited labeled data and harnessing the untapped potential of unlabeled medical images, our novel generative model presents a promising direction for enhancing semi-supervised disease classification in the field of medical image analysis.

arxiv情報

著者 Yan Zhang,Chun Li,Zhaoxia Liu,Ming Li
発行日 2024-05-07 13:11:08+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク