SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba

要約

内視鏡的粘膜下層剥離術(ESD)は、当初は早期胃がんの治療のために設計された低侵襲手術ですが、現在ではさまざまな胃腸病変に広く使用されています。
コンピュータ支援手術システムは、ESD 処置の精度と安全性を向上させる上で重要な役割を果たしていますが、その有効性は手術段階の正確な認識によって制限されます。
ESD は病変の特徴や組織構造が異なる複雑な性質を持っているため、リアルタイムの手術段階認識アルゴリズムには課題が生じています。
既存の手術段階認識アルゴリズムは、ビデオベースのシナリオで時間的コンテキストを効率的にキャプチャするのに苦労しており、パフォーマンスが不十分になります。
これらの問題に対処するために、ESD 手術段階認識のための新しい Mamba ベースのフレームワークである SPRMamba を提案します。
SPRMamba は、長期時相モデリングに Mamba の強みを活用すると同時に、Scaled Residual TranMamba ブロックを導入してきめの細かい詳細のキャプチャを強化し、時間畳み込みネットワークやトランスフォーマーなどの従来の時相モデルの制限を克服します。
さらに、臨床現場でのリアルタイム位相認識に不可欠な処理を高速化するために、時間的サンプル戦略が導入されています。
ESD385 データセットと胆嚢摘出術 Cholec80 データセットに対する広範なテストにより、SPRMamba が既存の最先端の方法を上回り、さまざまな手術段階認識タスクにわたって優れた堅牢性を示すことが実証されました。

要約(オリジナル)

Endoscopic Submucosal Dissection (ESD) is a minimally invasive procedure initially designed for the treatment of early gastric cancer but is now widely used for various gastrointestinal lesions. Computer-assisted Surgery systems have played a crucial role in improving the precision and safety of ESD procedures, however, their effectiveness is limited by the accurate recognition of surgical phases. The intricate nature of ESD, with different lesion characteristics and tissue structures, presents challenges for real-time surgical phase recognition algorithms. Existing surgical phase recognition algorithms struggle to efficiently capture temporal contexts in video-based scenarios, leading to insufficient performance. To address these issues, we propose SPRMamba, a novel Mamba-based framework for ESD surgical phase recognition. SPRMamba leverages the strengths of Mamba for long-term temporal modeling while introducing the Scaled Residual TranMamba block to enhance the capture of fine-grained details, overcoming the limitations of traditional temporal models like Temporal Convolutional Networks and Transformers. Moreover, a Temporal Sample Strategy is introduced to accelerate the processing, which is essential for real-time phase recognition in clinical settings. Extensive testing on the ESD385 dataset and the cholecystectomy Cholec80 dataset demonstrates that SPRMamba surpasses existing state-of-the-art methods and exhibits greater robustness across various surgical phase recognition tasks.

arxiv情報

著者 Xiangning Zhang,Jinnan Chen,Qingwei Zhang,Chengfeng Zhou,Zhengjie Zhang,Xiaobo Li,Dahong Qian
発行日 2024-09-18 16:26:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク