Automatic Polyp Segmentation with Multiple Kernel Dilated Convolution Network

要約

結腸内視鏡検査による前癌性ポリープの検出と除去は、世界中の結腸直腸癌の予防のための主要な技術です。
ただし、結腸直腸ポリープのミス率は内視鏡医の間で大幅に異なります。
コンピュータ支援診断(CAD)システムは、大腸ポリープの検出において内視鏡医を支援し、内視鏡医間のばらつきを最小限に抑えることができることはよく知られています。
この研究では、ポリープデータ分布の大幅な変化に対してロバストな自動ポリープセグメンテーションのために、{\textbf{MKDCNet}}という名前の新しい深層学習アーキテクチャを紹介します。
MKDCNetは、事前にトレーニングされた\ textit{ResNet50}をエンコーダーとして使用するエンコーダー-デコーダーニューラルネットワークであり、視野を拡大してより堅牢で異種の表現を学習する新しい\ textit {マルチカーネル拡張畳み込み(MKDC)}ブロックです。

4つの公的に利用可能なポリープデータセットと細胞核データセットに関する広範な実験は、提案されたMKDCNetが、同じデータセットでトレーニングおよびテストされた場合、また異なる分布からの目に見えないポリープデータセットでテストされた場合、最先端の方法よりも優れていることを示しています。
豊富な結果で、提案されたアーキテクチャの堅牢性を実証しました。
効率の観点から、私たちのアルゴリズムはRTX 3090 GPUで毎秒($ \ approx45 $)フレームで処理できます。
MKDCNetは、臨床結腸内視鏡検査用のリアルタイムシステムを構築するための強力なベンチマークとなります。
提案されたMKDCNetのコードは、\url{https://github.com/nikhilroxtomar/MKDCNet}で入手できます。

要約(オリジナル)

The detection and removal of precancerous polyps through colonoscopy is the primary technique for the prevention of colorectal cancer worldwide. However, the miss rate of colorectal polyp varies significantly among the endoscopists. It is well known that a computer-aided diagnosis (CAD) system can assist endoscopists in detecting colon polyps and minimize the variation among endoscopists. In this study, we introduce a novel deep learning architecture, named {\textbf{MKDCNet}}, for automatic polyp segmentation robust to significant changes in polyp data distribution. MKDCNet is simply an encoder-decoder neural network that uses the pre-trained \textit{ResNet50} as the encoder and novel \textit{multiple kernel dilated convolution (MKDC)} block that expands the field of view to learn more robust and heterogeneous representation. Extensive experiments on four publicly available polyp datasets and cell nuclei dataset show that the proposed MKDCNet outperforms the state-of-the-art methods when trained and tested on the same dataset as well when tested on unseen polyp datasets from different distributions. With rich results, we demonstrated the robustness of the proposed architecture. From an efficiency perspective, our algorithm can process at ($\approx45$) frames per second on RTX 3090 GPU. MKDCNet can be a strong benchmark for building real-time systems for clinical colonoscopies. The code of the proposed MKDCNet is available at \url{https://github.com/nikhilroxtomar/MKDCNet}.

arxiv情報

著者 Nikhil Kumar Tomar,Abhishek Srivastava,Ulas Bagci,Debesh Jha
発行日 2022-06-13 15:47:38+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク