要約
ディープ ラーニング モデルは、大規模なデータセット (ラベル付きまたはラベルなし) を使用したトレーニングの恩恵を受けます。
この動機に従って、データの不均一性、ラベル ノイズ、
および欠落している注釈。
データの不均一性とラベル ノイズを最小限に抑えるために、自動データ クリーニングにシンプルなヒューリスティックを採用しています。
さらに、教師と生徒のセットアップ、注釈の代入、および不明な注釈の存在下で学習するための不確実性に基づくトレーニングを利用した、半教師あり学習アプローチを開発します。
私たちの実験結果は、私たちのアプローチで大規模なデータセットから学習すると、データに注釈が欠けているにもかかわらず、テストのパフォーマンスが大幅に向上することを示しています。
さらに、モデルによって予測されたセグメンテーション マスクから生成された輪郭は、手動で生成された輪郭と同様に臨床的に受け入れられることがわかっています。
要約(オリジナル)
Deep learning models benefit from training with a large dataset (labeled or unlabeled). Following this motivation, we present an approach to learn a deep learning model for the automatic segmentation of Organs at Risk (OARs) in cervical cancer radiation treatment from a large clinically available dataset of Computed Tomography (CT) scans containing data inhomogeneity, label noise, and missing annotations. We employ simple heuristics for automatic data cleaning to minimize data inhomogeneity and label noise. Further, we develop a semi-supervised learning approach utilizing a teacher-student setup, annotation imputation, and uncertainty-guided training to learn in presence of missing annotations. Our experimental results show that learning from a large dataset with our approach yields a significant improvement in the test performance despite missing annotations in the data. Further, the contours generated from the segmentation masks predicted by our model are found to be equally clinically acceptable as manually generated contours.
arxiv情報
著者 | Monika Grewal,Dustin van Weersel,Henrike Westerveld,Peter A. N. Bosman,Tanja Alderliesten |
発行日 | 2023-02-21 13:24:40+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google