要約
CT研究におけるユニバーサル病変検出とタグ(ULDT)は、腫瘍の負担評価と、時間の経過に伴う病変状態(成長/収縮)の進行を追跡するために重要です。
ただし、完全に注釈されたデータの欠如は、効果的なULDTアプローチの開発を妨げます。
アルゴリズム開発のために、以前の研究では、Deeplesion Dataset(4,427人の患者、10,594の研究、32,120 CTスライス、32,735の病変、8つの身体部分ラベル)を使用していましたが、このデータセットは完全に注釈が付けられておらず、クラスの不均衡が含まれています。
これらの問題に対処するために、この作業では、ULDTのセルフトレーニングパイプラインを開発しました。
VFNETモデルは、CT研究の病変を検出および分類するために、Deeplesion(境界ボックス +タグ)の限られた11.5%サブセット(境界ボックス +タグ)でトレーニングされました。
次に、より大きな目に見えないデータサブセットの新規病変候補をそのトレーニングセットに特定し、組み込み、複数のラウンドで自己訓練を受けました。
複数の自己訓練実験が異なるしきい値ポリシーで実施され、高品質の予測病変を選択し、クラスの不均衡をカバーしました。
直接的な自己訓練により、過小評価されたクラスを犠牲にして、過剰に表現された病変クラスの感受性が改善されることがわかりました。
ただし、自己訓練中に採掘された病変をさまざまなしきい値ポリシーとともにアップサンプリングすると、クラスバランスなしのセルフトレーニング(72 \%対78.5 \%)とは対照的に、4 FPで6.5%の感度が増加しました(78.8.8.8.5 \%の同じ自己訓練ポリシーと比較して、同じ自己トレーニングポリシーと比較して11.7 \%の増加が得られました。
さらに、8つの病変クラスすべての4FPでの感度が改善または維持された結果を示しています。
要約(オリジナル)
Universal lesion detection and tagging (ULDT) in CT studies is critical for tumor burden assessment and tracking the progression of lesion status (growth/shrinkage) over time. However, a lack of fully annotated data hinders the development of effective ULDT approaches. Prior work used the DeepLesion dataset (4,427 patients, 10,594 studies, 32,120 CT slices, 32,735 lesions, 8 body part labels) for algorithmic development, but this dataset is not completely annotated and contains class imbalances. To address these issues, in this work, we developed a self-training pipeline for ULDT. A VFNet model was trained on a limited 11.5\% subset of DeepLesion (bounding boxes + tags) to detect and classify lesions in CT studies. Then, it identified and incorporated novel lesion candidates from a larger unseen data subset into its training set, and self-trained itself over multiple rounds. Multiple self-training experiments were conducted with different threshold policies to select predicted lesions with higher quality and cover the class imbalances. We discovered that direct self-training improved the sensitivities of over-represented lesion classes at the expense of under-represented classes. However, upsampling the lesions mined during self-training along with a variable threshold policy yielded a 6.5\% increase in sensitivity at 4 FP in contrast to self-training without class balancing (72\% vs 78.5\%) and a 11.7\% increase compared to the same self-training policy without upsampling (66.8\% vs 78.5\%). Furthermore, we show that our results either improved or maintained the sensitivity at 4FP for all 8 lesion classes.
arxiv情報
著者 | Alexander Shieh,Tejas Sudharshan Mathai,Jianfei Liu,Angshuman Paul,Ronald M. Summers |
発行日 | 2025-04-07 15:57:03+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google