CECT: Controllable Ensemble CNN and Transformer for COVID-19 Image Classification

要約

新型コロナウイルス感染症(COVID-19)のパンデミックにより、世界中で数億人の感染者と多数の死者が発生しています。
ここでは、制御可能なアンサンブル畳み込みニューラル ネットワークとトランスフォーマーによる新しい分類ネットワーク CECT を開発し、タイムリーで正確な COVID-19 診断を提供します。
CECT は、並列畳み込みエンコーダ ブロック、集合転置畳み込みデコーダ ブロック、およびウィンドウ アテンション分類ブロックで構成されます。
各ブロックは、入力から 28 $\times$ 28 から 224 $\times$ 224 までのさまざまなスケールで特徴をキャプチャし、充実した包括的な情報を構成します。
既存の方法とは異なり、当社の CECT は、高度なモジュール設計を必要とせずに、マルチローカルおよびグローバルの両方のスケールで機能をキャプチャできます。
さらに、さまざまなスケールでの局所特徴の寄与は、提案されたアンサンブル係数を使用して制御できます。
私たちは 2 つの公開 COVID-19 データセットで CECT を評価し、データセット内評価で 98.1% という最高の精度に達し、既存の最先端の手法を上回りました。
さらに、開発された CECT は、データセット間評価において未確認データセットに対して 90.9% の精度を達成し、並外れた汎化能力を示しています。
優れた特徴捕捉能力と一般化能力により、CECT は強力な診断ツールとして他の医療シナリオにも拡張できると考えられます。
コードは https://github.com/NUS-Tim/CECT で入手できます。

要約(オリジナル)

The COVID-19 pandemic has resulted in hundreds of million cases and numerous deaths worldwide. Here, we develop a novel classification network CECT by controllable ensemble convolutional neural network and transformer to provide a timely and accurate COVID-19 diagnosis. The CECT is composed of a parallel convolutional encoder block, an aggregate transposed-convolutional decoder block, and a windowed attention classification block. Each block captures features at different scales from 28 $\times$ 28 to 224 $\times$ 224 from the input, composing enriched and comprehensive information. Different from existing methods, our CECT can capture features at both multi-local and global scales without any sophisticated module design. Moreover, the contribution of local features at different scales can be controlled with the proposed ensemble coefficients. We evaluate CECT on two public COVID-19 datasets and it reaches the highest accuracy of 98.1% in the intra-dataset evaluation, outperforming existing state-of-the-art methods. Moreover, the developed CECT achieves an accuracy of 90.9% on the unseen dataset in the inter-dataset evaluation, showing extraordinary generalization ability. With remarkable feature capture ability and generalization ability, we believe CECT can be extended to other medical scenarios as a powerful diagnosis tool. Code is available at https://github.com/NUS-Tim/CECT.

arxiv情報

著者 Zhaoshan Liu,Lei Shen
発行日 2024-03-31 11:58:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク