OSSAR: Towards Open-Set Surgical Activity Recognition in Robot-assisted Surgery

要約

自動ロボット手術やコンピュータ支援介入の分野では、ロボット手術活動を理解することが最も重要です。
手術活動認識専用の既存のアルゴリズムは、主に事前定義されたクローズドセット パラダイムに対応しており、現実世界のオープンセット シナリオの課題を無視しています。
このようなアルゴリズムは、トレーニング段階では見えないクラスに由来するテスト サンプルが存在すると、うまく動作しないことがよくあります。
この問題に取り組むために、当社は革新的なオープンセット手術活動認識 (OSSAR) フレームワークを導入します。
私たちのソリューションは、超球面逆数点戦略を活用して、特徴空間における既知のクラスと未知のクラスの区別を強化します。
さらに、モデルのキャリブレーションを改良することで閉集合における過信の問題に対処し、未知のクラスを既知のクラスとして誤って分類することを回避します。
私たちの主張を裏付けるために、公開されている JIGSAWS データセットを利用して、オープンセットの手術活動ベンチマークを確立します。
さらに、外科活動タスクのための内視鏡的粘膜下層剥離に関する新しいデータセットも収集します。
これらのデータセットに対する広範な比較とアブレーション実験により、既存の最先端のアプローチよりも私たちの方法が大幅に優れていることが実証されました。
私たちが提案するソリューションは、現実世界の手術シナリオの課題に効果的に対処できます。
私たちのコードは https://github.com/longbai1006/OSSAR で公開されています。

要約(オリジナル)

In the realm of automated robotic surgery and computer-assisted interventions, understanding robotic surgical activities stands paramount. Existing algorithms dedicated to surgical activity recognition predominantly cater to pre-defined closed-set paradigms, ignoring the challenges of real-world open-set scenarios. Such algorithms often falter in the presence of test samples originating from classes unseen during training phases. To tackle this problem, we introduce an innovative Open-Set Surgical Activity Recognition (OSSAR) framework. Our solution leverages the hyperspherical reciprocal point strategy to enhance the distinction between known and unknown classes in the feature space. Additionally, we address the issue of over-confidence in the closed set by refining model calibration, avoiding misclassification of unknown classes as known ones. To support our assertions, we establish an open-set surgical activity benchmark utilizing the public JIGSAWS dataset. Besides, we also collect a novel dataset on endoscopic submucosal dissection for surgical activity tasks. Extensive comparisons and ablation experiments on these datasets demonstrate the significant outperformance of our method over existing state-of-the-art approaches. Our proposed solution can effectively address the challenges of real-world surgical scenarios. Our code is publicly accessible at https://github.com/longbai1006/OSSAR.

arxiv情報

著者 Long Bai,Guankun Wang,Jie Wang,Xiaoxiao Yang,Huxin Gao,Xin Liang,An Wang,Mobarakol Islam,Hongliang Ren
発行日 2024-02-10 16:23:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, cs.RO パーマリンク