ArthroPhase: A Novel Dataset and Method for Phase Recognition in Arthroscopic Video

要約

この研究の目的は、最初の関節鏡検査データセットを導入し、新しいトランスベースのモデルを開発することにより、関節鏡視鏡手術、特に前十字靭帯(ACL)再構築における外科期認識を前進させることです。
私たちは、限られた視野、閉塞、視覚的歪みを含む関節鏡ビデオの特定の課題に対処するために、時空間的特徴を活用することにより、関節鏡部の外科期認識のベンチマークを確立することを目指しています。
ACL27データセットを開発しました。これは、それぞれが手術段階でラベル付けされたACL手術の27のビデオで構成されています。
私たちのモデルでは、トランスベースのアーキテクチャを採用しており、resNet-50およびトランス層を介した一時的なフレームごとの特徴抽出を利用しています。
このアプローチは、時空間的特徴を統合し、外科的進行指数(SPI)を導入して手術の進行を定量化します。
モデルのパフォーマンスは、ACL27およびCHOLEC80データセットの精度、精度、リコール、およびJaccardインデックスを使用して評価されました。
提案されたモデルは、ACL27データセットで72.91%の全体的な精度を達成しました。
CHOLEC80データセットでは、モデルは92.4%の精度で最先端の方法で同等のパフォーマンスを達成しました。
SPIは、それぞれACL27およびCHOLEC80データセットで10.6%と9.86%の出力誤差を示し、信頼できる手術の進行推定を示しています。
この研究では、関節鏡検査の外科期認識の大幅な進歩を導入し、包括的なデータセットと堅牢なトランスベースのモデルを提供します。
結果は、モデルの有効性と一般化可能性を検証し、外科的訓練、リアルタイム支援、および整形外科手術の運用効率を改善する可能性を強調しています。
公開されているデータセットとコードは、この重要な分野での将来の研究開発を促進します。

要約(オリジナル)

This study aims to advance surgical phase recognition in arthroscopic procedures, specifically Anterior Cruciate Ligament (ACL) reconstruction, by introducing the first arthroscopy dataset and developing a novel transformer-based model. We aim to establish a benchmark for arthroscopic surgical phase recognition by leveraging spatio-temporal features to address the specific challenges of arthroscopic videos including limited field of view, occlusions, and visual distortions. We developed the ACL27 dataset, comprising 27 videos of ACL surgeries, each labeled with surgical phases. Our model employs a transformer-based architecture, utilizing temporal-aware frame-wise feature extraction through a ResNet-50 and transformer layers. This approach integrates spatio-temporal features and introduces a Surgical Progress Index (SPI) to quantify surgery progression. The model’s performance was evaluated using accuracy, precision, recall, and Jaccard Index on the ACL27 and Cholec80 datasets. The proposed model achieved an overall accuracy of 72.91% on the ACL27 dataset. On the Cholec80 dataset, the model achieved a comparable performance with the state-of-the-art methods with an accuracy of 92.4%. The SPI demonstrated an output error of 10.6% and 9.86% on ACL27 and Cholec80 datasets respectively, indicating reliable surgery progression estimation. This study introduces a significant advancement in surgical phase recognition for arthroscopy, providing a comprehensive dataset and a robust transformer-based model. The results validate the model’s effectiveness and generalizability, highlighting its potential to improve surgical training, real-time assistance, and operational efficiency in orthopedic surgery. The publicly available dataset and code will facilitate future research and development in this critical field.

arxiv情報

著者 Ali Bahari Malayeri,Matthias Seibold,Nicola Cavalcanti,Jonas Hein,Sascha Jecklin,Lazaros Vlachopoulos,Sandro Fucentese,Sandro Hodel,Philipp Furnstahl
発行日 2025-02-13 16:32:33+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク