要約
Out-of-distribution (OOD) 一般化は、深層学習における重要な課題です。
これは、テスト サンプルがトレーニング データとは異なる分布から抽出された場合に特に重要です。
私たちは、OOD の一般化を改善するために結腸直腸ポリープのセグメンテーションのための Transformer と残差アップサンプリング ネットワークに基づいた、新しいリアルタイム深層学習ベースのアーキテクチャである TransRUPNet を開発します。
提案されたアーキテクチャである TransRUPNet は、3 つのエンコーダ ブロック、3 つのデコーダ ブロック、およびネットワークの終端にある追加のアップサンプリング ブロックで構成されるエンコーダ/デコーダ ネットワークです。
$256\times256$ の画像サイズで、提案された方法は、平均サイコロ係数スコア 0.7786、和集合上の平均 0.7210 で、毎秒 \textbf{47.07} フレームという優れたリアルタイム処理速度を達成します。
分布ポリープ データセット。
公開されている PolypGen データセット (この場合は OOD データセット) の結果は、TransRUPNet が分布内のデータセットに対して高い精度を維持しながらリアルタイムのフィードバックを提供できることを示唆しています。
さらに、既存の方法と比較して OOD データセットのパフォーマンスが大幅に向上することを示すことで、提案された方法の一般化可能性を実証します。
要約(オリジナル)
Out-of-distribution (OOD) generalization is a critical challenge in deep learning. It is specifically important when the test samples are drawn from a different distribution than the training data. We develop a novel real-time deep learning based architecture, TransRUPNet that is based on a Transformer and residual upsampling network for colorectal polyp segmentation to improve OOD generalization. The proposed architecture, TransRUPNet, is an encoder-decoder network that consists of three encoder blocks, three decoder blocks, and some additional upsampling blocks at the end of the network. With the image size of $256\times256$, the proposed method achieves an excellent real-time operation speed of \textbf{47.07} frames per second with an average mean dice coefficient score of 0.7786 and mean Intersection over Union of 0.7210 on the out-of-distribution polyp datasets. The results on the publicly available PolypGen dataset (OOD dataset in our case) suggest that TransRUPNet can give real-time feedback while retaining high accuracy for in-distribution dataset. Furthermore, we demonstrate the generalizability of the proposed method by showing that it significantly improves performance on OOD datasets compared to the existing methods.
arxiv情報
著者 | Debesh Jha,Nikhil Kumar Tomar,Debayan Bhattacharya,Ulas Bagci |
発行日 | 2023-07-05 15:29:55+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google