Tissue Cross-Section and Pen Marking Segmentation in Whole Slide Images

要約

組織セグメンテーションは、背景領域を除外することでスライド画像全体 (WSI) 解析の計算コストを削減するための日常的な前処理ステップです。
従来の画像処理技術は、組織のセグメンテーションに一般的に使用されていますが、多くの場合、非典型的なケースではパラメータ値を手動で調整する必要があり、背景からすべてのスライドおよびスキャンアーチファクトを除外できず、脂肪組織をセグメンテーションできません。
特にペンマーキングアーティファクトは、除去しないとその後の分析でバイアスの潜在的な原因となる可能性があります。
さらに、いくつかの用途では個々の断面を分離する必要がありますが、組織の断片化や隣接する配置により困難な場合があります。
これらの問題に対処するために、200 個の H&E 染色 WSI のデータセットを使用して、組織およびペン マーキング セグメンテーションのための畳み込みニューラル ネットワークを開発します。
組織の断面を分離するために、2D ヒストグラム内の断面の予測重心位置のクラスタリングに基づく新しい後処理方法を提案します。
独立したテスト セットでは、モデルは組織セグメンテーションで平均 Dice スコア 0.981$\pm$0.033、ペン マーキング セグメンテーションで平均 Dice スコア 0.912$\pm$0.090 を達成しました。
注釈付き断面の数と分離された断面の数の間の平均絶対差は 0.075$\pm$0.350 でした。
我々の結果は、提案されたモデルが、多くの一般的なスライドおよびスキャンアーティファクトに対して堅牢でありながら、WSI の H&E 染色組織断面とペンマーキングを正確にセグメント化できることを示しています。
トレーニング済みのモデル パラメーターと後処理メソッドを備えたモデルは、SlideSegmenter と呼ばれる Python パッケージとして公開されています。

要約(オリジナル)

Tissue segmentation is a routine preprocessing step to reduce the computational cost of whole slide image (WSI) analysis by excluding background regions. Traditional image processing techniques are commonly used for tissue segmentation, but often require manual adjustments to parameter values for atypical cases, fail to exclude all slide and scanning artifacts from the background, and are unable to segment adipose tissue. Pen marking artifacts in particular can be a potential source of bias for subsequent analyses if not removed. In addition, several applications require the separation of individual cross-sections, which can be challenging due to tissue fragmentation and adjacent positioning. To address these problems, we develop a convolutional neural network for tissue and pen marking segmentation using a dataset of 200 H&E stained WSIs. For separating tissue cross-sections, we propose a novel post-processing method based on clustering predicted centroid locations of the cross-sections in a 2D histogram. On an independent test set, the model achieved a mean Dice score of 0.981$\pm$0.033 for tissue segmentation and a mean Dice score of 0.912$\pm$0.090 for pen marking segmentation. The mean absolute difference between the number of annotated and separated cross-sections was 0.075$\pm$0.350. Our results demonstrate that the proposed model can accurately segment H&E stained tissue cross-sections and pen markings in WSIs while being robust to many common slide and scanning artifacts. The model with trained model parameters and post-processing method are made publicly available as a Python package called SlideSegmenter.

arxiv情報

著者 Ruben T. Lucassen,Willeke A. M. Blokx,Mitko Veta
発行日 2024-01-24 15:09:12+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク