SegSTRONG-C: Segmenting Surgical Tools Robustly On Non-adversarial Generated Corruptions — An EndoVis’24 Challenge

要約

外科的データサイエンスは、外科的ビデオ分析のためのエンドツーエンドのディープニューラルネットワーク(DNNS)の優れた性能により、急速な進歩を遂げています。
彼らの成功にもかかわらず、エンドツーエンドのDNNは、軽度の腐敗の影響を受けやすく、モデルのパフォーマンスを大幅に損なうことが証明されています。
この脆弱性は、特に外科的データサイエンスにおけるハイステークスの意思決定のために、最先端のテクノロジーの翻訳にとって大きな関心事となっています。
Segstrong-Cを紹介します。これは、献身的な外科データサイエンスのベンチマークと挑戦を紹介し、予期せぬがもっともらしい非逆の腐敗とそれを改善しようとする現代の方法の能力の下でモデルの劣化をよりよく理解することを目指しています。
包括的なベースライン実験と広範なコミュニティエンゲージメントからの参加提案を通じて、Segstrong-Cはモデルの故障の重要なテーマを明らかにし、堅牢性を改善するための有望な方向性を特定します。
チャレンジ受賞者のパフォーマンスは、腐敗タイプの未発表テストセットで平均0.9394 DSCと0.9301 NSDを達成し、出血、煙、および低輝度を達成し、0.1471 DSCと0.2584 NSDのインスピレーションを示しています。
結論として、Segstrong-Cチャレンジは、モデルの堅牢性を高めるためのいくつかの実用的なアプローチを特定しましたが、ほとんどのアプローチは、既知の、時には非常に深刻な制限に依存していました。
先を見据えて、私たちは、データの増強やトレーニングスケールを超えて、非逆数の堅牢性における知的多様性と創造性を拡大することを提唱し、腐敗に対する普遍的な堅牢性を高め、外科データ科学のより豊かなアプリケーションを可能にする新しいパラダイムを求めています。

要約(オリジナル)

Surgical data science has seen rapid advancement due to the excellent performance of end-to-end deep neural networks (DNNs) for surgical video analysis. Despite their successes, end-to-end DNNs have been proven susceptible to even minor corruptions, substantially impairing the model’s performance. This vulnerability has become a major concern for the translation of cutting-edge technology, especially for high-stakes decision-making in surgical data science. We introduce SegSTRONG-C, a benchmark and challenge in surgical data science dedicated, aiming to better understand model deterioration under unforeseen but plausible non-adversarial corruption and the capabilities of contemporary methods that seek to improve it. Through comprehensive baseline experiments and participating submissions from widespread community engagement, SegSTRONG-C reveals key themes for model failure and identifies promising directions for improving robustness. The performance of challenge winners, achieving an average 0.9394 DSC and 0.9301 NSD across the unreleased test sets with corruption types: bleeding, smoke, and low brightness, shows inspiring improvement of 0.1471 DSC and 0.2584 NSD in average comparing to strongest baseline methods with UNet architecture trained with AutoAugment. In conclusion, the SegSTRONG-C challenge has identified some practical approaches for enhancing model robustness, yet most approaches relied on conventional techniques that have known, and sometimes quite severe, limitations. Looking ahead, we advocate for expanding intellectual diversity and creativity in non-adversarial robustness beyond data augmentation or training scale, calling for new paradigms that enhance universal robustness to corruptions and may enable richer applications in surgical data science.

arxiv情報

著者 Hao Ding,Yuqian Zhang,Tuxun Lu,Ruixing Liang,Hongchao Shu,Lalithkumar Seenivasan,Yonghao Long,Qi Dou,Cong Gao,Yicheng Leng,Seok Bong Yoo,Eung-Joo Lee,Negin Ghamsarian,Klaus Schoeffmann,Raphael Sznitman,Zijian Wu,Yuxin Chen,Septimiu E. Salcudean,Samra Irshad,Shadi Albarqouni,Seong Tae Kim,Yueyi Sun,An Wang,Long Bai,Hongliang Ren,Ihsan Ullah,Ho-Gun Ha,Attaullah Khan,Hyunki Lee,Satoshi Kondo,Satoshi Kasai,Kousuke Hirasawa,Sita Tailor,Ricardo Sanchez-Matilla,Imanol Luengo,Tianhao Fu,Jun Ma,Bo Wang,Marcos Fernández-Rodríguez,Estevao Lima,João L. Vilaça,Mathias Unberath
発行日 2025-04-07 23:44:14+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.RO パーマリンク