要約
深いニューラルネットワークは、画像分類、セグメンテーション、ランドマーク検出など、さまざまなタスクに医療ドメインに広く適用されています。
ただし、利用可能な注釈と画像の両方の点で、それらのアプリケーションはしばしばデータ不足によって妨げられます。
この研究では、X線イメージングにおける限られた注釈データの課題に特に対処する、ランドマーク検出タスクに拡散確率モデル(DDPMS)を除去する新しいアプリケーションを紹介します。
私たちの主要な革新は、このドメインで以前に説明されていないアプローチであるランドマーク検出における自己監督の事前トレーニングのためにDDPMを活用することにあります。
この方法により、最小限の注釈付きトレーニングデータ(わずか50の画像)で正確なランドマーク検出が可能になり、3つの一般的なX線ベンチマークデータセットにわたって、イメージネットの監督された事前トレーニングと従来の自己監視技術の両方を上回ります。
私たちの知る限り、この作業は、データの希少性を緩和するための少数のショット体制で貴重なトレーニング前アプローチを提供する可能性のあるランドマーク検出における自己監視学習のための拡散モデルの最初の応用を表しています。
要約(オリジナル)
Deep neural networks have been extensively applied in the medical domain for various tasks, including image classification, segmentation, and landmark detection. However, their application is often hindered by data scarcity, both in terms of available annotations and images. This study introduces a novel application of denoising diffusion probabilistic models (DDPMs) to the landmark detection task, specifically addressing the challenge of limited annotated data in x-ray imaging. Our key innovation lies in leveraging DDPMs for self-supervised pre-training in landmark detection, a previously unexplored approach in this domain. This method enables accurate landmark detection with minimal annotated training data (as few as 50 images), surpassing both ImageNet supervised pre-training and traditional self-supervised techniques across three popular x-ray benchmark datasets. To our knowledge, this work represents the first application of diffusion models for self-supervised learning in landmark detection, which may offer a valuable pre-training approach in few-shot regimes, for mitigating data scarcity.
arxiv情報
著者 | Roberto Di Via,Francesca Odone,Vito Paolo Pastore |
発行日 | 2025-03-06 17:03:35+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google