Re-thinking and Re-labeling LIDC-IDRI for Robust Pulmonary Cancer Prediction

要約

LIDC-IDRIデータベースは、肺がん予測の最も一般的なベンチマークです。
ただし、放射線科医による主観的な評価では、LIDCの結節は、病理学的グラウンドトゥルースとはまったく異なる悪性腫瘍の注釈を持っている可能性があり、トレーニング中にラベル割り当てエラーとその後の監督バイアスが発生します。
したがって、LIDCデータベースには、学習ベースのがん予測のためのより客観的なラベルが必要です。
病理学的検査によって診断された180の結節を含む非常に小さなデータセットに基づいて、この堅牢なベンチマークで検証された元の注釈バイアスの影響を軽減するために、LIDCデータにラベルを付け直すことを提案します。
この論文では、メトリック学習に基づく同様の結節検索によって新しいラベルを提供することが、効果的な再ラベル付け戦略であることを示しています。
これらの再ラベル付けされたLIDC結節のトレーニングは、モデルのパフォーマンスの向上につながります。これは、不確実な結節の新しいラベルが追加されたときに強化されます。
さらに、LIDCの再ラベル付けは、病理学的に証明された大規模な結節データベースを構築することで長期的な解決策を提供しながら、強力な肺がん予測のための現在の便利な方法であると推測します。

要約(オリジナル)

The LIDC-IDRI database is the most popular benchmark for lung cancer prediction. However, with subjective assessment from radiologists, nodules in LIDC may have entirely different malignancy annotations from the pathological ground truth, introducing label assignment errors and subsequent supervision bias during training. The LIDC database thus requires more objective labels for learning-based cancer prediction. Based on an extra small dataset containing 180 nodules diagnosed by pathological examination, we propose to re-label LIDC data to mitigate the effect of original annotation bias verified on this robust benchmark. We demonstrate in this paper that providing new labels by similar nodule retrieval based on metric learning would be an effective re-labeling strategy. Training on these re-labeled LIDC nodules leads to improved model performance, which is enhanced when new labels of uncertain nodules are added. We further infer that re-labeling LIDC is current an expedient way for robust lung cancer prediction while building a large pathological-proven nodule database provides the long-term solution.

arxiv情報

著者 Hanxiao Zhang,Xiao Gu,Minghui Zhang,Weihao Yu,Liang Chen,Zhexin Wang,Feng Yao,Yun Gu,Guang-Zhong Yang
発行日 2022-07-28 17:18:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク