CathFlow: Self-Supervised Segmentation of Catheters in Interventional Ultrasound Using Optical Flow and Transformers

要約

低侵襲の血管内処置においては、造影血管造影が依然として最も堅牢なイメージング技術です。
しかし、長期にわたる放射線被曝により、患者と臨床医の健康が犠牲になります。
代替手段として、インターベンショナル超音波には、放射線が発生しない、展開が早い、手術室の設置面積が小さいなどの顕著な利点があります。
しかし、超音波は解釈が難しく、アーチファクトやノイズが非常に発生しやすいです。
さらに、インターベンション放射線科医は、患者を効果的に診断して治療する資格を得る前に広範なトレーニングを受ける必要があるため、スタッフ不足やオープンソースのデータセットの不足につながっています。
この研究では、ラベル付けされたデータを必要とせずに、長手方向の超音波画像内のカテーテルをセグメント化する自己教師あり深層学習アーキテクチャを導入することで、両方の問題に対処しようとしています。
ネットワーク アーキテクチャは、アテンション イン アテンション メカニズムで構築されたセグメンテーション トランスフォーマーである AiAReSeg に基づいて構築されており、時間と空間を超えた特徴の変化を学習できます。
トレーニングを容易にするために、物理学に基づくカテーテル挿入シミュレーションに基づいた合成超音波データを使用し、そのデータを独自の CT 超音波共通ドメインである CACTUSS に変換してセグメンテーションのパフォーマンスを向上させました。
FlowNet2 を使用して隣接するフレーム間のオプティカル フローを計算することでグランド トゥルース セグメンテーション マスクを生成し、しきい値処理を実行してバイナリ マップ推定値を取得しました。
最後に、未確認の合成データとシリコン大動脈ファントムから収集された画像で構成されるテストデータセットでモデルを検証し、将来の臨床データへの応用の可能性を実証しました。

要約(オリジナル)

In minimally invasive endovascular procedures, contrast-enhanced angiography remains the most robust imaging technique. However, it is at the expense of the patient and clinician’s health due to prolonged radiation exposure. As an alternative, interventional ultrasound has notable benefits such as being radiation-free, fast to deploy, and having a small footprint in the operating room. Yet, ultrasound is hard to interpret, and highly prone to artifacts and noise. Additionally, interventional radiologists must undergo extensive training before they become qualified to diagnose and treat patients effectively, leading to a shortage of staff, and a lack of open-source datasets. In this work, we seek to address both problems by introducing a self-supervised deep learning architecture to segment catheters in longitudinal ultrasound images, without demanding any labeled data. The network architecture builds upon AiAReSeg, a segmentation transformer built with the Attention in Attention mechanism, and is capable of learning feature changes across time and space. To facilitate training, we used synthetic ultrasound data based on physics-driven catheter insertion simulations, and translated the data into a unique CT-Ultrasound common domain, CACTUSS, to improve the segmentation performance. We generated ground truth segmentation masks by computing the optical flow between adjacent frames using FlowNet2, and performed thresholding to obtain a binary map estimate. Finally, we validated our model on a test dataset, consisting of unseen synthetic data and images collected from silicon aorta phantoms, thus demonstrating its potential for applications to clinical data in the future.

arxiv情報

著者 Alex Ranne,Liming Kuang,Yordanka Velikova,Nassir Navab,Ferdinando Rodriguez y Baena
発行日 2024-09-10 14:21:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク