Self-supervised pre-training with diffusion model for few-shot landmark detection in x-ray images

要約

ディープ ニューラル ネットワークは、画像分類、セグメンテーション、ランドマーク検出などのさまざまなタスクのために医療分野で広く適用されています。
ただし、それらのアプリケーションは、利用可能な注釈と画像の両方の点でデータ不足によって妨げられることがよくあります。
この研究では、ランドマーク検出タスクへのノイズ除去拡散確率モデル (DDPM) の新しいアプリケーションを導入し、特に X 線イメージングにおける注釈付きデータが限られているという課題に取り組んでいます。
私たちの主な革新は、ランドマーク検出における自己教師あり事前トレーニングに DDPM を活用することにあります。これは、この分野ではこれまで検討されていなかったアプローチです。
この方法は、最小限の注釈付きトレーニング データ (わずか 50 画像) で正確なランドマーク検出を可能にし、3 つの一般的な X 線ベンチマーク データセットにわたる ImageNet 教師付き事前トレーニングと従来の自己教師付き手法の両方を上回ります。
私たちの知る限り、この研究は、ランドマーク検出における自己教師あり学習のための拡散モデルの最初の応用を表しており、データ不足を軽減するために、数ショット方式での貴重な事前トレーニングアプローチを提供する可能性があります。

要約(オリジナル)

Deep neural networks have been extensively applied in the medical domain for various tasks, including image classification, segmentation, and landmark detection. However, their application is often hindered by data scarcity, both in terms of available annotations and images. This study introduces a novel application of denoising diffusion probabilistic models (DDPMs) to the landmark detection task, specifically addressing the challenge of limited annotated data in x-ray imaging. Our key innovation lies in leveraging DDPMs for self-supervised pre-training in landmark detection, a previously unexplored approach in this domain. This method enables accurate landmark detection with minimal annotated training data (as few as 50 images), surpassing both ImageNet supervised pre-training and traditional self-supervised techniques across three popular x-ray benchmark datasets. To our knowledge, this work represents the first application of diffusion models for self-supervised learning in landmark detection, which may offer a valuable pre-training approach in few-shot regimes, for mitigating data scarcity.

arxiv情報

著者 Roberto Di Via,Francesca Odone,Vito Paolo Pastore
発行日 2024-10-29 16:10:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク