要約
3D 医用画像のボリュームごとのラベル付けは、専門知識を必要とする時間のかかる作業です。
その結果、半教師あり学習 (SSL) 技術を使用して、限られたラベル付きデータでモデルをトレーニングすることへの関心が高まっています。
ただし、課題と実際の応用は SSL を超えて、教師なしドメイン アダプテーション (UDA) や半教師ありドメイン一般化 (SemiDG) などの設定にまで及びます。
この作業は、3 つの設定すべてを処理できる汎用 SSL フレームワークを開発することを目的としています。
既存の SSL フレームワークでこの目標を達成するには、2 つの主な障害があると考えられます。1) 分布不変の特徴を捕捉する弱点。
2) ラベルなしデータがラベル付きデータに圧倒される傾向があり、トレーニング中にラベル付きデータへの過剰適合につながります。
これらの問題に対処するために、私たちは集約と分離のフレームワークを提案します。
集約部分は、複数の分布/ドメインから集約された情報から分布不変の特徴を抽出することによって共通の知識セットを構築する拡散エンコーダーで構成されます。
デカップリング部分は、トレーニング プロセスをラベル付きデータとラベルなしデータで分離する 3 つのデコーダーで構成され、ラベル付きデータ、特定のドメイン、クラスへの過剰適合を回避します。
SSL、クラス不均衡 SSL、UDA、および SemiDG の 4 つのベンチマーク データセットで、提案したフレームワークを評価します。
結果は、4 つの設定すべてにおいて最先端の方法と比較して顕著な改善を示しており、より困難な SSL シナリオに取り組むためのフレームワークの可能性を示しています。
コードとモデルは https://github.com/xmed-lab/GenericSSL から入手できます。
要約(オリジナル)
Volume-wise labeling in 3D medical images is a time-consuming task that requires expertise. As a result, there is growing interest in using semi-supervised learning (SSL) techniques to train models with limited labeled data. However, the challenges and practical applications extend beyond SSL to settings such as unsupervised domain adaptation (UDA) and semi-supervised domain generalization (SemiDG). This work aims to develop a generic SSL framework that can handle all three settings. We identify two main obstacles to achieving this goal in the existing SSL framework: 1) the weakness of capturing distribution-invariant features; and 2) the tendency for unlabeled data to be overwhelmed by labeled data, leading to over-fitting to the labeled data during training. To address these issues, we propose an Aggregating & Decoupling framework. The aggregating part consists of a Diffusion encoder that constructs a common knowledge set by extracting distribution-invariant features from aggregated information from multiple distributions/domains. The decoupling part consists of three decoders that decouple the training process with labeled and unlabeled data, thus avoiding over-fitting to labeled data, specific domains and classes. We evaluate our proposed framework on four benchmark datasets for SSL, Class-imbalanced SSL, UDA and SemiDG. The results showcase notable improvements compared to state-of-the-art methods across all four settings, indicating the potential of our framework to tackle more challenging SSL scenarios. Code and models are available at: https://github.com/xmed-lab/GenericSSL.
arxiv情報
著者 | Haonan Wang,Xiaomeng Li |
発行日 | 2023-10-17 14:58:18+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google