Data Efficient Contrastive Learning in Histopathology using Active Sampling




– 組織学的画像の高解像度により、アノテーション付きトレーニングデータが多量に必要なため、ディープラーニングベースの診断システムにおいて自己教師付きの方法が提案されている。
– プリテキストタスクを使用する自己教師付きトレーニングプロセスは、学習された特徴空間に制約がなく、特にデータの不均衡が顕著であるため、時間がかかり、特徴表現が劣ることがある。
– この研究では、少数のラベルと小さなプロキシネットワークを使用してトレーニングセットをアクティブにサンプリングすることを提案し、サンプル要件を93%低減し、トレーニング時間を62%削減することができる。


Deep Learning based diagnostics systems can provide accurate and robust quantitative analysis in digital pathology. These algorithms require large amounts of annotated training data which is impractical in pathology due to the high resolution of histopathological images. Hence, self-supervised methods have been proposed to learn features using ad-hoc pretext tasks. The self-supervised training process is time consuming and often leads to subpar feature representation due to a lack of constrain on the learnt feature space, particularly prominent under data imbalance. In this work, we propose to actively sample the training set using a handful of labels and a small proxy network, decreasing sample requirement by 93% and training time by 62%.


著者 Tahsin Reasat,David S. Smith
発行日 2023-05-11 03:18:29+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス, OpenAI

カテゴリー: cs.CV パーマリンク