要約
正確な外科相認識は、コンピューター支援の介入を進めるために重要ですが、ラベル付きのデータの希少性は、信頼できる深い学習モデルのトレーニングを妨げます。
特に擬似標識では、半教師の学習(SSL)は、完全に監視された方法よりも有望ですが、しばしば信頼できる擬似ラベル評価メカニズムを欠いています。
このギャップに対処するために、外科的相認識を高めるために時間的および変換不変の両方を組み込んだ、新しいSSLフレームワーク、二重不変性自己トレーニング(DIST)を提案します。
2段階のセルフトレーニングプロセスは、信頼できる擬似ラベルを動的に選択し、堅牢な擬似スーパービジョンを確保します。
私たちのアプローチは、ノイズの多い擬似適応のリスク、真のデータ分布への決定境界を操縦し、目に見えないデータへの一般化を改善するリスクを軽減します。
白内障とChoLEC80データセットの評価は、私たちの方法が最先端のSSLアプローチよりも優れていることを示しており、さまざまなネットワークアーキテクチャにわたって監視されたベースラインとSSLベースラインの両方を常に上回っています。
要約(オリジナル)
Accurate surgical phase recognition is crucial for advancing computer-assisted interventions, yet the scarcity of labeled data hinders training reliable deep learning models. Semi-supervised learning (SSL), particularly with pseudo-labeling, shows promise over fully supervised methods but often lacks reliable pseudo-label assessment mechanisms. To address this gap, we propose a novel SSL framework, Dual Invariance Self-Training (DIST), that incorporates both Temporal and Transformation Invariance to enhance surgical phase recognition. Our two-step self-training process dynamically selects reliable pseudo-labels, ensuring robust pseudo-supervision. Our approach mitigates the risk of noisy pseudo-labels, steering decision boundaries toward true data distribution and improving generalization to unseen data. Evaluations on Cataract and Cholec80 datasets show our method outperforms state-of-the-art SSL approaches, consistently surpassing both supervised and SSL baselines across various network architectures.
arxiv情報
| 著者 | Sahar Nasirihaghighi,Negin Ghamsarian,Raphael Sznitman,Klaus Schoeffmann | 
| 発行日 | 2025-01-29 13:07:56+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, Google
