ModeTv2: GPU-accelerated Motion Decomposition Transformer for Pairwise Optimization in Medical Image Registration

要約

変形可能な画像レジストレーションは、医療画像処理において重要な役割を果たし、疾患の診断や画像に基づく介入を支援します。
従来の反復手法は時間がかかり、ディープ ラーニング (DL) はソリューションを高速化しますが、使いやすさと精度の課題に直面しています。
この調査では、強化されたモーション分解トランスフォーマー (ModeTv2) オペレーターを備えたピラミッド ネットワークを導入し、従来の方法と同様の優れたペアワイズ最適化 (PO) を紹介します。
計算効率を高めるために、CUDA 拡張機能を使用して ModeT オペレーターを再実装します。
さらに、変形フィールドを改良し、変形のリアリズムを改善し、パラメータを削減する RegHead モジュールを提案します。
PO を採用することにより、提案されたネットワークは精度、効率、汎用性のバランスをとります。
2 つの公開脳 MRI データセットと 1 つの腹部 CT データセットに関する広範な実験により、ネットワークが PO に適していることが実証され、使いやすさと解釈可能性が向上した DL モデルが提供されます。
コードは公開されています。

要約(オリジナル)

Deformable image registration plays a crucial role in medical imaging, aiding in disease diagnosis and image-guided interventions. Traditional iterative methods are slow, while deep learning (DL) accelerates solutions but faces usability and precision challenges. This study introduces a pyramid network with the enhanced motion decomposition Transformer (ModeTv2) operator, showcasing superior pairwise optimization (PO) akin to traditional methods. We re-implement ModeT operator with CUDA extensions to enhance its computational efficiency. We further propose RegHead module which refines deformation fields, improves the realism of deformation and reduces parameters. By adopting the PO, the proposed network balances accuracy, efficiency, and generalizability. Extensive experiments on two public brain MRI datasets and one abdominal CT dataset demonstrate the network’s suitability for PO, providing a DL model with enhanced usability and interpretability. The code is publicly available.

arxiv情報

著者 Haiqiao Wang,Zhuoyuan Wang,Dong Ni,Yi Wang
発行日 2024-03-25 08:09:22+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク