ConKeD: Multiview contrastive descriptor learning for keypoint-based retinal image registration

要約

網膜画像の登録は、医療現場で広く応用されているため、最も重要です。
これに関連して、網膜画像登録のための記述子を学習するための新しい深層学習アプローチである ConKeD を提案します。
現在の登録方法とは対照的に、私たちのアプローチでは、利用可能なトレーニング サンプルからの追加情報の利用を可能にする、新しいマルチポジティブ マルチネガティブ コントラスト学習戦略を採用しています。
これにより、限られたトレーニング データから高品質の記述子を学習することが可能になります。
ConKeD をトレーニングして評価するために、これらの記述子を、ディープ ニューラル ネットワークを使用して検出されるドメイン固有のキーポイント、特に血管の分岐点や交差点と組み合わせます。
私たちの実験結果は、この新しいマルチポジティブ・マルチネガティブ戦略の利点を示しており、広く使用されている三重項損失手法 (シングルポジティブおよびシングルネガティブ) およびシングルポジティブマルチネガティブの代替手法よりも優れています。
さらに、ConKeD とドメイン固有のキーポイントを組み合わせることで、網膜画像レジストレーションの最先端の方法と同等の結果が得られると同時に、前処理の回避、トレーニング サンプルの使用量の削減、必要な検出サンプルの削減などの重要な利点が得られます。
キーポイントなど。
したがって、ConKeD は、網膜画像登録のための深層学習ベースの方法の開発と応用の促進に向けて有望な可能性を示しています。

要約(オリジナル)

Retinal image registration is of utmost importance due to its wide applications in medical practice. In this context, we propose ConKeD, a novel deep learning approach to learn descriptors for retinal image registration. In contrast to current registration methods, our approach employs a novel multi-positive multi-negative contrastive learning strategy that enables the utilization of additional information from the available training samples. This makes it possible to learn high quality descriptors from limited training data. To train and evaluate ConKeD, we combine these descriptors with domain-specific keypoints, particularly blood vessel bifurcations and crossovers, that are detected using a deep neural network. Our experimental results demonstrate the benefits of the novel multi-positive multi-negative strategy, as it outperforms the widely used triplet loss technique (single-positive and single-negative) as well as the single-positive multi-negative alternative. Additionally, the combination of ConKeD with the domain-specific keypoints produces comparable results to the state-of-the-art methods for retinal image registration, while offering important advantages such as avoiding pre-processing, utilizing fewer training samples, and requiring fewer detected keypoints, among others. Therefore, ConKeD shows a promising potential towards facilitating the development and application of deep learning-based methods for retinal image registration.

arxiv情報

著者 David Rivas-Villar,Álvaro S. Hervella,José Rouco,Jorge Novo
発行日 2024-01-11 13:22:54+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク