Towards a Benchmark for Colorectal Cancer Segmentation in Endorectal Ultrasound Videos: Dataset and Model Development

要約

直腸内超音波検査 (ERUS) は、結腸直腸がんの深達度および浸潤境界を診断するための高い信頼性を提供する重要な画像診断手段です。
しかし、高品質のアノテーションを備えた大規模な ERUS データセットが不足しているため、自動超音波診断の開発が妨げられています。
この論文では、結腸直腸がんのセグメンテーション、検出、浸潤深さのステージングなど、さまざまな ERUS シナリオをカバーする最初のベンチマーク データセットを収集し、注釈を付けました。
当社の ERUS-10K データセットは、77 のビデオと 10,000 の高解像度の注釈付きフレームで構成されています。
このデータセットに基づいて、Adaptive Sparse-context TRansformer (ASTR) という結腸直腸がんセグメンテーションのベンチマーク モデルをさらに導入します。
ASTR は、スキャン モードの不一致、時間情報、および計算の低さという 3 つの考慮事項に基づいて設計されています。
さまざまなスキャン モードに一般化するために、生のセクター画像とリニア スキャン画像の間で変換する適応型スキャン モード拡張が提案されています。
時間情報をマイニングするために、フレーム間のローカル機能とグローバル機能を統合するためにスパース コンテキスト トランスフォーマーが組み込まれています。
計算の複雑さを軽減するために、補助フレームからコンテキスト特徴を抽出するためにスパース コンテキスト ブロックが導入されています。
最後に、ベンチマーク データセットでは、提案された ASTR モデルは直腸がんセグメンテーションにおいて 77.6% の Dice スコアを達成し、以前の最先端の方法を大幅に上回りました。

要約(オリジナル)

Endorectal ultrasound (ERUS) is an important imaging modality that provides high reliability for diagnosing the depth and boundary of invasion in colorectal cancer. However, the lack of a large-scale ERUS dataset with high-quality annotations hinders the development of automatic ultrasound diagnostics. In this paper, we collected and annotated the first benchmark dataset that covers diverse ERUS scenarios, i.e. colorectal cancer segmentation, detection, and infiltration depth staging. Our ERUS-10K dataset comprises 77 videos and 10,000 high-resolution annotated frames. Based on this dataset, we further introduce a benchmark model for colorectal cancer segmentation, named the Adaptive Sparse-context TRansformer (ASTR). ASTR is designed based on three considerations: scanning mode discrepancy, temporal information, and low computational complexity. For generalizing to different scanning modes, the adaptive scanning-mode augmentation is proposed to convert between raw sector images and linear scan ones. For mining temporal information, the sparse-context transformer is incorporated to integrate inter-frame local and global features. For reducing computational complexity, the sparse-context block is introduced to extract contextual features from auxiliary frames. Finally, on the benchmark dataset, the proposed ASTR model achieves a 77.6% Dice score in rectal cancer segmentation, largely outperforming previous state-of-the-art methods.

arxiv情報

著者 Yuncheng Jiang,Yiwen Hu,Zixun Zhang,Jun Wei,Chun-Mei Feng,Xuemei Tang,Xiang Wan,Yong Liu,Shuguang Cui,Zhen Li
発行日 2024-08-19 15:04:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク