Long-tailed Medical Diagnosis with Relation-aware Representation Learning and Iterative Classifier Calibration

要約

最近、コンピューター支援診断により、有望なパフォーマンスが実証されており、臨床医のワークロードを効果的に緩和しています。
ただし、異なる疾患間の固有のサンプルの不均衡は、アルゴリズムを過半数カテゴリに偏っており、まれなカテゴリのパフォーマンスが低下します。
既存の作品は、この課題を長期尾のある問題として定式化し、特徴の表現と分類を分離することでそれに取り組むことを試みました。
しかし、不均衡な分布とテールクラスからの限られたサンプルにより、これらの作品は偏った表現学習と不十分な分類器のキャリブレーションを起こしやすくなります。
これらの問題に取り組むために、ロングテールされたデータセットでのバランスの取れた医療画像分類のための新しいロングテール医療診断(LMD)フレームワークを提案します。
初期段階では、エンコーダーがさまざまなデータ増強を通じて固有のセマンティック機能をキャプチャするよう奨励することにより、関係認識表現学習(RRL)スキームを開発します。
その後の段階では、分類器を繰り返し調整するための反復分類器キャリブレーション(ICC)スキームを提案します。
これは、多数のバランスの取れた仮想機能を生成し、期待最大化方法を使用してエンコーダーを微調整することによって達成されます。
提案されているICCは、少数派のカテゴリを補償して、多数派クラスの診断知識を維持しながら、偏りのない分類器の最適化を促進します。
3つの公共の長期尾のある医療データセットでの包括的な実験は、LMDフレームワークが最先端のアプローチを大幅に上回っていることを示しています。
ソースコードは、https://github.com/peterlipan/lmdでアクセスできます。

要約(オリジナル)

Recently computer-aided diagnosis has demonstrated promising performance, effectively alleviating the workload of clinicians. However, the inherent sample imbalance among different diseases leads algorithms biased to the majority categories, leading to poor performance for rare categories. Existing works formulated this challenge as a long-tailed problem and attempted to tackle it by decoupling the feature representation and classification. Yet, due to the imbalanced distribution and limited samples from tail classes, these works are prone to biased representation learning and insufficient classifier calibration. To tackle these problems, we propose a new Long-tailed Medical Diagnosis (LMD) framework for balanced medical image classification on long-tailed datasets. In the initial stage, we develop a Relation-aware Representation Learning (RRL) scheme to boost the representation ability by encouraging the encoder to capture intrinsic semantic features through different data augmentations. In the subsequent stage, we propose an Iterative Classifier Calibration (ICC) scheme to calibrate the classifier iteratively. This is achieved by generating a large number of balanced virtual features and fine-tuning the encoder using an Expectation-Maximization manner. The proposed ICC compensates for minority categories to facilitate unbiased classifier optimization while maintaining the diagnostic knowledge in majority classes. Comprehensive experiments on three public long-tailed medical datasets demonstrate that our LMD framework significantly surpasses state-of-the-art approaches. The source code can be accessed at https://github.com/peterlipan/LMD.

arxiv情報

著者 Li Pan,Yupei Zhang,Qiushi Yang,Tan Li,Zhen Chen
発行日 2025-02-05 14:57:23+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.LG, cs.MM パーマリンク