Clinical Contrastive Learning for Biomarker Detection

要約

本論文では、臨床データから抽出可能なラベルに基づく医用画像の対比学習のための、新しい正負集合選択戦略を紹介する。医療分野では、診断や治療プロセスの異なる段階において異なる目的を果たす、データに対する様々なラベルが存在する。臨床ラベルとバイオマーカーラベルがその例である。一般に、臨床ラベルは日常診療で定期的に収集されるため大量に入手しやすいが、バイオマーカーラベルは入手に専門家の解析と解釈が必要である。眼科分野では、これまでの研究で、臨床値と光コヒーレンス・トモグラフィー(OCT)スキャン内に現れるバイオマーカーの構造に相関があることが示されている。我々は、臨床データとバイオマーカーデータの関係を利用し、バイオマーカー分類のパフォーマンスを向上させる。これは、バイオマーカーラベルのないデータに対して、より大量の臨床データを擬似ラベルとして活用し、教師付き対比損失でバックボーンネットワークを学習するための正と負のインスタンスを選択することで達成される。このようにして、バックボーンネットワークは、利用可能な臨床データ分布に沿った表現空間を学習する。その後、OCTスキャンから直接これらの重要な病気の指標を分類するために、この方法で学習したネットワークを、より少ない量のバイオマーカーのラベル付きデータでクロスエントロピロスにより微調整を行う。本手法は、個々のバイオマーカー検出の精度において、最先端の自己教師付き手法を5%も上回ることが示された。

要約(オリジナル)

This paper presents a novel positive and negative set selection strategy for contrastive learning of medical images based on labels that can be extracted from clinical data. In the medical field, there exists a variety of labels for data that serve different purposes at different stages of a diagnostic and treatment process. Clinical labels and biomarker labels are two examples. In general, clinical labels are easier to obtain in larger quantities because they are regularly collected during routine clinical care, while biomarker labels require expert analysis and interpretation to obtain. Within the field of ophthalmology, previous work has shown that clinical values exhibit correlations with biomarker structures that manifest within optical coherence tomography (OCT) scans. We exploit this relationship between clinical and biomarker data to improve performance for biomarker classification. This is accomplished by leveraging the larger amount of clinical data as pseudo-labels for our data without biomarker labels in order to choose positive and negative instances for training a backbone network with a supervised contrastive loss. In this way, a backbone network learns a representation space that aligns with the clinical data distribution available. Afterwards, we fine-tune the network trained in this manner with the smaller amount of biomarker labeled data with a cross-entropy loss in order to classify these key indicators of disease directly from OCT scans. Our method is shown to outperform state of the art self-supervised methods by as much as 5% in terms of accuracy on individual biomarker detection.

arxiv情報

著者 Kiran Kokilepersaud,Mohit Prabhushankar,Ghassan AlRegib
発行日 2022-11-09 18:29:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク