A Self-Supervised Framework for Improved Generalisability in Ultrasound B-mode Image Segmentation


超音波(US)画像診断は、その非侵襲的で安全な性質から、臨床的に非常に貴重なものである。しかし、US画像の解釈は困難で、かなりの専門知識と時間を必要とし、しばしばエラーになりやすい。ディープラーニングは、セグメンテーションなどの支援ソリューションを提供する。教師ありの手法は、大規模かつ高品質で、一貫してラベル付けされたデータセットに依存するが、このデータセットの作成は困難である。さらに、これらの手法は、分布外のデータではパフォーマンスが低下する傾向があり、臨床的有用性が制限される。自己教師あり学習(SSL)は、ラベル付けされていないデータを活用してモデルの性能と汎化性を向上させる、有望な代替手段として浮上してきた。我々は、新しいRelation Contrastive Loss (RCL)を組み込んだ、BモードUS画像用に調整されたコントラストSSLアプローチを紹介する。RCLは、学習可能なメトリックを通して、正と負のサンプルペアを区別することにより、明確な特徴の学習を促す。さらに、US画像の表現学習のために、空間と周波数に基づく補強戦略を提案する。我々のアプローチは、3つの公的な乳房USデータセットにおいて、特にデータが限られたシナリオにおいて、従来の教師ありセグメンテーション法を大幅に上回る。Dice類似度メトリックの顕著な改善として、BUSIデータセットの20%と50%でそれぞれ4%、BrEaSTデータセットの20%と50%でそれぞれ6%と9%、UDIATデータセットの20%と50%でそれぞれ6.4%と3.7%の改善がある。さらに、分布外のUDIATデータセットでは、BUSIとBrEaSTの訓練データのそれぞれ20%と50%を使用した教師ありベースラインと比較して、20.6%と13.6%の性能向上により、優れた一般性を実証した。我々の研究は、ドメインに着想を得たSSLが、特にデータが限られた条件下で、米国のセグメンテーションを改善できることを強調している。


Ultrasound (US) imaging is clinically invaluable due to its noninvasive and safe nature. However, interpreting US images is challenging, requires significant expertise, and time, and is often prone to errors. Deep learning offers assistive solutions such as segmentation. Supervised methods rely on large, high-quality, and consistently labeled datasets, which are challenging to curate. Moreover, these methods tend to underperform on out-of-distribution data, limiting their clinical utility. Self-supervised learning (SSL) has emerged as a promising alternative, leveraging unlabeled data to enhance model performance and generalisability. We introduce a contrastive SSL approach tailored for B-mode US images, incorporating a novel Relation Contrastive Loss (RCL). RCL encourages learning of distinct features by differentiating positive and negative sample pairs through a learnable metric. Additionally, we propose spatial and frequency-based augmentation strategies for the representation learning on US images. Our approach significantly outperforms traditional supervised segmentation methods across three public breast US datasets, particularly in data-limited scenarios. Notable improvements on the Dice similarity metric include a 4% increase on 20% and 50% of the BUSI dataset, nearly 6% and 9% improvements on 20% and 50% of the BrEaST dataset, and 6.4% and 3.7% improvements on 20% and 50% of the UDIAT dataset, respectively. Furthermore, we demonstrate superior generalisability on the out-of-distribution UDIAT dataset with performance boosts of 20.6% and 13.6% compared to the supervised baseline using 20% and 50% of the BUSI and BrEaST training data, respectively. Our research highlights that domain-inspired SSL can improve US segmentation, especially under data-limited conditions.


著者 Edward Ellis,Andrew Bulpitt,Nasim Parsa,Michael F Byrne,Sharib Ali
発行日 2025-02-04 17:06:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.AI, cs.CV, cs.LG パーマリンク