要約
パパニコロウ検査サンプルのスクリーニングは、子宮頸がん関連の死亡率を効果的に低下させますが、訓練を受けた細胞病理学者が不足しているため、リソースの少ない環境で広く採用されることはありません。
リソースに制約のある国に適したデジタル化された細胞診画像を分析するディープラーニングなどの AI アルゴリズムの開発は魅力的です。
成功したとはいえ、注釈付きの大規模なトレーニング データセットを収集するという代償を払うことになり、コストと時間がかかります。
私たちの研究は、デジタル化された細胞学スライドからサンプリングできる多数のラベルのない画像が、自己教師あり学習法が繁栄し、さまざまなダウンストリーム タスクで既製のディープ ラーニング モデルよりも優れた性能を発揮できる機が熟した土台を作ることを示しています。
同じように、最新の拡張戦略を使用してパフォーマンスとデータ効率が向上したことを報告しています。
要約(オリジナル)
Screening Papanicolaou test samples effectively reduces cervical cancer-related mortality, but the lack of trained cytopathologists prevents its widespread adoption in low-resource settings. Developing AI algorithms, e.g., deep learning to analyze the digitized cytology images suited to resource-constrained countries is appealing. Albeit successful, it comes at the price of collecting large annotated training datasets, which is both costly and time-consuming. Our study shows that the large number of unlabeled images that can be sampled from digitized cytology slides make for a ripe ground where self-supervised learning methods can thrive and even outperform off-the-shelf deep learning models on various downstream tasks. Along the same line, we report improved performance and data efficiency using modern augmentation strategies.
arxiv情報
著者 | Thomas Stegmüller,Christian Abbet,Behzad Bozorgtabar,Holly Clarke,Patrick Petignat,Pierre Vassilakos,Jean-Philippe Thiran |
発行日 | 2023-02-10 11:46:48+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google