The Endoscapes Dataset for Surgical Scene Segmentation, Object Detection, and Critical View of Safety Assessment: Official Splits and Benchmark

要約

この技術レポートでは、Endoscapes の詳細な概要を説明します。Endoscapes は、安全性重要視 (CVS) の自動評価を対象とした、非常に複雑な注釈が付いた腹腔鏡下胆嚢摘出術 (LC) ビデオのデータセットです。
Endoscapes は、3 人の異なる臨床専門家によるセグメンテーション マスク、バウンディング ボックス、および CVS 評価を使用して、まばらではあるが定期的に注釈が付けられたフレームを含む 201 の LC ビデオで構成されています。
合計すると、201 ビデオから CVS で注釈が付けられた 11090 フレームと、ツールと解剖学的バウンディング ボックスで注釈が付けられた 1933 フレームに加え、ツー​​ルと解剖学的セグメンテーション マスクで注釈が付けられた 201 ビデオのうち 50 からの追加の 422 フレームがあります。
このレポートでは、詳細なデータセット統計 (サイズ、クラス分布、データセット分割など) と、インスタンスのセグメンテーション、オブジェクト検出、CVS 予測の包括的なパフォーマンス ベンチマークを提供します。
データセットとモデルのチェックポイントは、https://github.com/CAMMA-public/Endoscapes で公開されています。

要約(オリジナル)

This technical report provides a detailed overview of Endoscapes, a dataset of laparoscopic cholecystectomy (LC) videos with highly intricate annotations targeted at automated assessment of the Critical View of Safety (CVS). Endoscapes comprises 201 LC videos with frames annotated sparsely but regularly with segmentation masks, bounding boxes, and CVS assessment by three different clinical experts. Altogether, there are 11090 frames annotated with CVS and 1933 frames annotated with tool and anatomy bounding boxes from the 201 videos, as well as an additional 422 frames from 50 of the 201 videos annotated with tool and anatomy segmentation masks. In this report, we provide detailed dataset statistics (size, class distribution, dataset splits, etc.) and a comprehensive performance benchmark for instance segmentation, object detection, and CVS prediction. The dataset and model checkpoints are publically available at https://github.com/CAMMA-public/Endoscapes.

arxiv情報

著者 Aditya Murali,Deepak Alapatt,Pietro Mascagni,Armine Vardazaryan,Alain Garcia,Nariaki Okamoto,Guido Costamagna,Didier Mutter,Jacques Marescaux,Bernard Dallemagne,Nicolas Padoy
発行日 2024-01-26 11:31:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV パーマリンク