SPRMamba: Surgical Phase Recognition for Endoscopic Submucosal Dissection with Mamba


コンピュータ支援手術システムは、ESD 処置の精度と安全性を向上させる上で重要な役割を果たしていますが、その有効性は手術段階の正確な認識によって制限されます。
ESD は病変の特徴や組織構造が異なる複雑な性質を持っているため、リアルタイムの手術段階認識アルゴリズムには課題が生じています。
これらの問題に対処するために、ESD 手術段階認識のための新しい Mamba ベースのフレームワークである SPRMamba を提案します。
SPRMamba は、長期時相モデリングに Mamba の強みを活用すると同時に、Scaled Residual TranMamba ブロックを導入してきめの細かい詳細のキャプチャを強化し、時間畳み込みネットワークやトランスフォーマーなどの従来の時相モデルの制限を克服します。
ESD385 データセットと胆嚢摘出術 Cholec80 データセットに対する広範なテストにより、SPRMamba が既存の最先端の方法を上回り、さまざまな手術段階認識タスクにわたって優れた堅牢性を示すことが実証されました。


Endoscopic Submucosal Dissection (ESD) is a minimally invasive procedure initially designed for the treatment of early gastric cancer but is now widely used for various gastrointestinal lesions. Computer-assisted Surgery systems have played a crucial role in improving the precision and safety of ESD procedures, however, their effectiveness is limited by the accurate recognition of surgical phases. The intricate nature of ESD, with different lesion characteristics and tissue structures, presents challenges for real-time surgical phase recognition algorithms. Existing surgical phase recognition algorithms struggle to efficiently capture temporal contexts in video-based scenarios, leading to insufficient performance. To address these issues, we propose SPRMamba, a novel Mamba-based framework for ESD surgical phase recognition. SPRMamba leverages the strengths of Mamba for long-term temporal modeling while introducing the Scaled Residual TranMamba block to enhance the capture of fine-grained details, overcoming the limitations of traditional temporal models like Temporal Convolutional Networks and Transformers. Moreover, a Temporal Sample Strategy is introduced to accelerate the processing, which is essential for real-time phase recognition in clinical settings. Extensive testing on the ESD385 dataset and the cholecystectomy Cholec80 dataset demonstrates that SPRMamba surpasses existing state-of-the-art methods and exhibits greater robustness across various surgical phase recognition tasks.


著者 Xiangning Zhang,Jinnan Chen,Qingwei Zhang,Chengfeng Zhou,Zhengjie Zhang,Xiaobo Li,Dahong Qian
発行日 2024-09-18 16:26:56+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク