TransRUPNet for Improved Out-of-Distribution Generalization in Polyp Segmentation

要約

Out-of-distribution (OOD) 一般化は、深層学習における重要な課題です。
これは、テスト サンプルがトレーニング データとは異なる分布から抽出された場合に特に重要です。
私たちは、OOD の一般化を改善するために結腸直腸ポリープのセグメンテーションのための Transformer と残差アップサンプリング ネットワークに基づいた、新しいリアルタイム深層学習ベースのアーキテクチャである TransRUPNet を開発します。
提案されたアーキテクチャである TransRUPNet は、3 つのエンコーダ ブロック、3 つのデコーダ ブロック、およびネットワークの終端にある追加のアップサンプリング ブロックで構成されるエンコーダ/デコーダ ネットワークです。
$256\times256$ の画像サイズで、提案された方法は、平均サイコロ係数スコア 0.7786、和集合上の平均 0.7210 で、毎秒 \textbf{47.07} フレームという優れたリアルタイム処理速度を達成します。
分布ポリープ データセット。
公開されている PolypGen データセット (この場合は OOD データセット) の結果は、TransRUPNet が分布内のデータセットに対して高い精度を維持しながらリアルタイムのフィードバックを提供できることを示唆しています。
さらに、既存の方法と比較して OOD データセットのパフォーマンスが大幅に向上することを示すことで、提案された方法の一般化可能性を実証します。

要約(オリジナル)

Out-of-distribution (OOD) generalization is a critical challenge in deep learning. It is specifically important when the test samples are drawn from a different distribution than the training data. We develop a novel real-time deep learning based architecture, TransRUPNet that is based on a Transformer and residual upsampling network for colorectal polyp segmentation to improve OOD generalization. The proposed architecture, TransRUPNet, is an encoder-decoder network that consists of three encoder blocks, three decoder blocks, and some additional upsampling blocks at the end of the network. With the image size of $256\times256$, the proposed method achieves an excellent real-time operation speed of \textbf{47.07} frames per second with an average mean dice coefficient score of 0.7786 and mean Intersection over Union of 0.7210 on the out-of-distribution polyp datasets. The results on the publicly available PolypGen dataset (OOD dataset in our case) suggest that TransRUPNet can give real-time feedback while retaining high accuracy for in-distribution dataset. Furthermore, we demonstrate the generalizability of the proposed method by showing that it significantly improves performance on OOD datasets compared to the existing methods.

arxiv情報

著者 Debesh Jha,Nikhil Kumar Tomar,Debayan Bhattacharya,Ulas Bagci
発行日 2023-07-05 15:29:55+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク