LapSeg3D: Weakly Supervised Semantic Segmentation of Point Clouds Representing Laparoscopic Scenes

要約

手術シーンのセマンティックセグメンテーションは、ロボット支援介入におけるタスク自動化の前提条件です。
手術シーンを表す点群のボクセルごとの注釈のための新しいDNNベースのアプローチであるLapSeg3Dを提案します。
トレーニングデータの手動注釈は非常に時間がかかるため、DNNのセグメント化されたラベルを生成するために使用される胆嚢の注釈用の半自律クラスタリングベースのパイプラインを導入します。
手動で注釈を付けたデータに対して評価すると、LapSeg3Dは、ex-vivoブタ肝臓のさまざまなデータセットで胆嚢セグメンテーションのF1スコア0.94を達成します。
LapSeg3Dは、さまざまなRGB-Dカメラシステムで記録されたさまざまな胆嚢およびデータセットにわたって正確に一般化することを示しています。

要約(オリジナル)

The semantic segmentation of surgical scenes is a prerequisite for task automation in robot assisted interventions. We propose LapSeg3D, a novel DNN-based approach for the voxel-wise annotation of point clouds representing surgical scenes. As the manual annotation of training data is highly time consuming, we introduce a semi-autonomous clustering-based pipeline for the annotation of the gallbladder, which is used to generate segmented labels for the DNN. When evaluated against manually annotated data, LapSeg3D achieves an F1 score of 0.94 for gallbladder segmentation on various datasets of ex-vivo porcine livers. We show LapSeg3D to generalize accurately across different gallbladders and datasets recorded with different RGB-D camera systems.

arxiv情報

著者 Benjamin Alt,Christian Kunz,Darko Katic,Rayan Younis,Rainer Jäkel,Beat Peter Müller-Stich,Martin Wagner,Franziska Mathis-Ullrich
発行日 2022-07-15 11:57:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 68T40, 68T42 (Primary), cs.AI, cs.CV, cs.LG, cs.RO, I.4 パーマリンク