A Nested U-Structure for Instrument Segmentation in Robotic Surgery

要約

ロボット支援手術は、医用画像技術とロボット技術の発展により大きく進歩しました。
医療現場の理解は手術のパフォーマンスを大幅に向上させることができ、ロボット器具のセマンティック セグメンテーションはロボット支援手術を可能にする重要なテクノロジーです。
しかし、複雑な手術環境においてどのように器具の位置を特定し、その姿勢を推定するかは依然として難しい根本的な問題です。
この論文では、ピクセル単位の機器セグメンテーションについて調査します。
この論文の貢献は 2 つあります。 1) 2 レベルのネストされた U 構造モデルを提案しました。これは、スキップ接続を備えたエンコーダ/デコーダ アーキテクチャであり、ネットワーク構造の各層は単純な重ね合わせの代わりに U 構造を採用しています。
畳み込み層の。
このモデルは、複数のスケールからより多くのコンテキスト情報を取得し、ローカル情報とグローバル情報をより適切に融合して高品質のセグメンテーションを実現できます。
2) 実験は、それぞれバイナリ セグメンテーション、パーツ セグメンテーション、およびタイプ セグメンテーションの 3 つのセグメンテーション タスクに対するアプローチのパフォーマンスを定性的および定量的に示すために行われました。

要約(オリジナル)

Robot-assisted surgery has made great progress with the development of medical imaging and robotics technology. Medical scene understanding can greatly improve surgical performance while the semantic segmentation of the robotic instrument is a key enabling technology for robot-assisted surgery. However, how to locate an instrument’s position and estimate their pose in complex surgical environments is still a challenging fundamental problem. In this paper, pixel-wise instrument segmentation is investigated. The contributions of the paper are twofold: 1) We proposed a two-level nested U-structure model, which is an encoder-decoder architecture with skip-connections and each layer of the network structure adopts a U-structure instead of a simple superposition of convolutional layers. The model can capture more context information from multiple scales and better fuse the local and global information to achieve high-quality segmentation. 2) Experiments have been conducted to qualitatively and quantitatively show the performance of our approach on three segmentation tasks: the binary segmentation, the parts segmentation, and the type segmentation, respectively.

arxiv情報

著者 Yanjie Xia,Shaochen Wang,Zhen Kan
発行日 2023-07-17 16:45:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.RO パーマリンク