A multi-centre polyp detection and segmentation dataset for generalisability assessment

要約

結腸内のポリープは、結腸内視鏡検査によって特定される癌の前駆体として広く知られています。
ほとんどのポリープは良性ですが、ポリープの数、サイズ、表面構造は結腸癌のリスクと関連しています。
ポリープの検出とセグメンテーションを自動化するために、いくつかの方法が開発されています。
ただし、主な問題は、大規模な多施設の専用データセットで厳密にテストされていないことです。その理由の 1 つは、包括的な公開データセットが存在しないことです。
その結果、開発された手法は異なる人口データセットに一般化できない可能性があります。
この点において、私たちは 300 人を超える患者を組み込んだ 6 つの独自のセンターからのデータセットを厳選しました。
このデータセットには、6 人の上級消化器科医によって検証されたポリープ境界の正確な描写を含む 3762 個の注釈付きポリープ ラベルを含む単一フレーム データとシーケンス データの両方が含まれています。
私たちの知る限り、これは計算科学者と専門の胃腸科医のチームによって厳選された、最も包括的な検出およびピクセルレベルのセグメンテーション データセット (\textit{PolypGen} と呼ばれます) です。
この文書では、データの構築と注釈戦略、品質保証、技術的検証についての洞察を提供します。
データセットは \url{ https://doi.org/10.7303/syn26376615} からダウンロードできます。

要約(オリジナル)

Polyps in the colon are widely known cancer precursors identified by colonoscopy. Whilst most polyps are benign, the polyp’s number, size and surface structure are linked to the risk of colon cancer. Several methods have been developed to automate polyp detection and segmentation. However, the main issue is that they are not tested rigorously on a large multicentre purpose-built dataset, one reason being the lack of a comprehensive public dataset. As a result, the developed methods may not generalise to different population datasets. To this extent, we have curated a dataset from six unique centres incorporating more than 300 patients. The dataset includes both single frame and sequence data with 3762 annotated polyp labels with precise delineation of polyp boundaries verified by six senior gastroenterologists. To our knowledge, this is the most comprehensive detection and pixel-level segmentation dataset (referred to as \textit{PolypGen}) curated by a team of computational scientists and expert gastroenterologists. The paper provides insight into data construction and annotation strategies, quality assurance, and technical validation. Our dataset can be downloaded from \url{ https://doi.org/10.7303/syn26376615}.

arxiv情報

著者 Sharib Ali,Debesh Jha,Noha Ghatwary,Stefano Realdon,Renato Cannizzaro,Osama E. Salem,Dominique Lamarque,Christian Daul,Michael A. Riegler,Kim V. Anonsen,Andreas Petlund,Pål Halvorsen,Jens Rittscher,Thomas de Lange,James E. East
発行日 2023-05-19 09:10:09+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク