CholecTrack20: A Dataset for Multi-Class Multiple Tool Tracking in Laparoscopic Surgery

要約

手術ビデオにおけるツールの追跡は、外科医のスキル評価、安全ゾーンの推定、低侵襲手術中の人間と機械のコラボレーションなどのタスクのためのコンピューター支援介入において不可欠です。
大規模なデータセットが不足しているため、この分野での人工知能の実装が妨げられています。
現在のデータセットは、過度に一般的な追跡形式化を示しており、多くの場合、手術のコンテキストが欠如しています。この欠陥は、ツールがカメラの範囲外に移動すると明らかになり、その結果、現実的な手術の表現を妨げる剛直な軌道が生じます。
この論文では、CholecTrack20 を導入することで、内視鏡処置の複雑さに合わせた、より正確で適応性のある追跡形式化の必要性に取り組んでいます。CholecTrack20 は、内視鏡の時間的持続時間を考慮するさまざまな方法を表す 3 つの視点にわたるマルチクラス マルチツール追跡用に細心の注意を払って注釈が付けられた広範なデータセットです。
ツールの軌道: (1) 術中、(2) 体内、および (3) カメラの範囲内の可視性。
このデータセットは、35,000 フレームを超える 20 の腹腔鏡ビデオと、空間的位置、カテゴリ、身元、オペレーター、フェーズ、および手術の視覚条件に関する詳細を含む 65,000 個の注釈付きツール インスタンスで構成されています。
この詳細なデータセットは、手順内で進化する支援要件に対応します。

要約(オリジナル)

Tool tracking in surgical videos is vital in computer-assisted intervention for tasks like surgeon skill assessment, safety zone estimation, and human-machine collaboration during minimally invasive procedures. The lack of large-scale datasets hampers Artificial Intelligence implementation in this domain. Current datasets exhibit overly generic tracking formalization, often lacking surgical context: a deficiency that becomes evident when tools move out of the camera’s scope, resulting in rigid trajectories that hinder realistic surgical representation. This paper addresses the need for a more precise and adaptable tracking formalization tailored to the intricacies of endoscopic procedures by introducing CholecTrack20, an extensive dataset meticulously annotated for multi-class multi-tool tracking across three perspectives representing the various ways of considering the temporal duration of a tool trajectory: (1) intraoperative, (2) intracorporeal, and (3) visibility within the camera’s scope. The dataset comprises 20 laparoscopic videos with over 35,000 frames and 65,000 annotated tool instances with details on spatial location, category, identity, operator, phase, and surgical visual conditions. This detailed dataset caters to the evolving assistive requirements within a procedure.

arxiv情報

著者 Chinedu Innocent Nwoye,Kareem Elgohary,Anvita Srinivas,Fauzan Zaid,Joël L. Lavanchy,Nicolas Padoy
発行日 2023-12-12 15:18:15+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク