Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images

要約

ここ数年、ディープ ニューラル ネットワークは、画像の分類やセグメンテーションからランドマークの検出に至るまで、医療分野のさまざまなタスクに広く適用されてきました。
ただし、医療分野でのこれらのテクノロジーの適用は、利用可能な注釈と画像の両方の点でデータ不足によって妨げられることがよくあります。
この研究では、X 線画像内のランドマーク検出のための拡散モデルに基づく新しい自己教師あり事前トレーニング プロトコルを導入します。
私たちの結果は、提案された自己教師ありフレームワークが、利用可能な注釈付きトレーニング画像の最小数 (最大 50) で正確なランドマーク検出を提供でき、ImageNet 教師あり事前トレーニングや最先端の​​自己教師あり事前トレーニングを上回るパフォーマンスを示していることを示しています。
3 つの一般的な X 線ベンチマーク データセットの場合。
私たちの知る限り、これはランドマーク検出における自己教師あり学習のための拡散モデルの最初の調査であり、データ不足を軽減するための、数ショット方式での貴重な事前トレーニングアプローチを提供する可能性があります。

要約(オリジナル)

In the last few years, deep neural networks have been extensively applied in the medical domain for different tasks, ranging from image classification and segmentation to landmark detection. However, the application of these technologies in the medical domain is often hindered by data scarcity, both in terms of available annotations and images. This study introduces a new self-supervised pre-training protocol based on diffusion models for landmark detection in x-ray images. Our results show that the proposed self-supervised framework can provide accurate landmark detection with a minimal number of available annotated training images (up to 50), outperforming ImageNet supervised pre-training and state-of-the-art self-supervised pre-trainings for three popular x-ray benchmark datasets. To our knowledge, this is the first exploration of diffusion models for self-supervised learning in landmark detection, which may offer a valuable pre-training approach in few-shot regimes, for mitigating data scarcity.

arxiv情報

著者 Roberto Di Via,Francesca Odone,Vito Paolo Pastore
発行日 2024-07-25 15:32:59+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク