Self-supervised learning-based cervical cytology for the triage of HPV-positive women in resource-limited settings and low-data regime

要約

パパニコローの検査サンプルのスクリーニングは、子宮頸がん関連死亡率の低下に非常に効果的であることが証明されています。
しかし、訓練を受けた細胞病理学者が不足しているため、資源が少ない環境での広範な導入が妨げられています。
ディープラーニングベースのテレサイトロジー診断は魅力的な代替手段として浮上していますが、それには注釈付きの大規模なトレーニング データセットを収集する必要があり、コストと時間がかかります。
この論文では、パップスミア検査のスライド全体画像から抽出できる豊富なラベルなし画像が自己教師あり学習法の肥沃な土壌を提供し、さまざまな下流タスクですぐに利用できる事前トレーニング済みモデルと比較してパフォーマンスの向上をもたらすことを実証します。
特に、 \textbf{C}ervical \textbf{C}ell \textbf{C}opy-\textbf{P}asting ($\texttt{C}^{3}\texttt{P}$) を次のように提案します。
効果的な拡張手法により、オープンソースのラベル付き単一セル データセットからラベルなしタイルへの知識の伝達が可能になります。
$\texttt{C}^{3}\texttt{P}$ は、単一細胞画像からの単純な転送よりも優れたパフォーマンスを発揮するだけでなく、複数のインスタンスの学習方法への有利な統合も実証します。
重要なのは、私たちのすべての実験は、低コストの技術を使用して取得された液体ベースの細胞診パップスミア画像で構成される、導入された \textit{社内} データセット上で行われているということです。
これは、リソースが少ない状況での診断に深層学習ベースのテレサイトロジーを活用するという私たちの目的と一致しています。

要約(オリジナル)

Screening Papanicolaou test samples has proven to be highly effective in reducing cervical cancer-related mortality. However, the lack of trained cytopathologists hinders its widespread implementation in low-resource settings. Deep learning-based telecytology diagnosis emerges as an appealing alternative, but it requires the collection of large annotated training datasets, which is costly and time-consuming. In this paper, we demonstrate that the abundance of unlabeled images that can be extracted from Pap smear test whole slide images presents a fertile ground for self-supervised learning methods, yielding performance improvements relative to readily available pre-trained models for various downstream tasks. In particular, we propose \textbf{C}ervical \textbf{C}ell \textbf{C}opy-\textbf{P}asting ($\texttt{C}^{3}\texttt{P}$) as an effective augmentation method, which enables knowledge transfer from open-source and labeled single-cell datasets to unlabeled tiles. Not only does $\texttt{C}^{3}\texttt{P}$ outperforms naive transfer from single-cell images, but we also demonstrate its advantageous integration into multiple instance learning methods. Importantly, all our experiments are conducted on our introduced \textit{in-house} dataset comprising liquid-based cytology Pap smear images obtained using low-cost technologies. This aligns with our objective of leveraging deep learning-based telecytology for diagnosis in low-resource settings.

arxiv情報

著者 Thomas Stegmüller,Christian Abbet,Behzad Bozorgtabar,Holly Clarke,Patrick Petignat,Pierre Vassilakos,Jean-Philippe Thiran
発行日 2023-06-07 16:05:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク