FA-Net: A Fuzzy Attention-aided Deep Neural Network for Pneumonia Detection in Chest X-Rays

要約

肺炎は、細菌、真菌、またはウイルスによって引き起こされる呼吸器感染症です。
これは多くの人々、特に高汚染レベル、不衛生な生活環境、過密、不十分な医療インフラを抱える発展途上国または後進国の人々に影響を及ぼします。
肺炎は肺に体液がたまる胸水を引き起こし、呼吸困難を引き起こす可能性があります。
効果的な治療を確実にし、生存率を高めるには、早期診断が非常に重要です。
胸部 X 線画像検査は、肺炎の診断に最も一般的に使用される方法です。
しかし、胸部 X 線の視覚的検査は難しく、主観的なものになる場合があります。
本研究では、胸部X線画像を用いて肺炎を自動検出するコンピュータ支援診断システムを開発した。
バイナリ クラス (肺炎と正常) 分類タスクとマルチクラス (細菌性肺炎、ウイルス性肺炎、正常) 分類タスクのバックボーンとして、DenseNet-121 と ResNet50 をそれぞれ使用しました。
また、ファジー チャネル選択的空間アテンション モジュール (FCSSAM) と呼ばれるチャネル固有の空間アテンション メカニズムを実装し、バックボーンによって抽出された特徴の無関係なチャネルを削除しながら、関連するチャネルの特定の空間領域を強調表示します。
私たちは、バイナリおよびマルチクラス分類設定を使用して、公的に入手可能な胸部 X 線データセットで提案されたアプローチを評価しました。
私たちが提案した方法は、バイナリ分類セットアップとマルチクラス分類セットアップでそれぞれ 97.15\% と 79.79\% の精度率を達成しました。
私たちが提案した方法の結果は、最先端の (SOTA) 方法よりも優れています。
提案されたモデルのコードは、https://github.com/AyushRoy2001/FA-Net から入手できます。

要約(オリジナル)

Pneumonia is a respiratory infection caused by bacteria, fungi, or viruses. It affects many people, particularly those in developing or underdeveloped nations with high pollution levels, unhygienic living conditions, overcrowding, and insufficient medical infrastructure. Pneumonia can cause pleural effusion, where fluids fill the lungs, leading to respiratory difficulty. Early diagnosis is crucial to ensure effective treatment and increase survival rates. Chest X-ray imaging is the most commonly used method for diagnosing pneumonia. However, visual examination of chest X-rays can be difficult and subjective. In this study, we have developed a computer-aided diagnosis system for automatic pneumonia detection using chest X-ray images. We have used DenseNet-121 and ResNet50 as the backbone for the binary class (pneumonia and normal) and multi-class (bacterial pneumonia, viral pneumonia, and normal) classification tasks, respectively. We have also implemented a channel-specific spatial attention mechanism, called Fuzzy Channel Selective Spatial Attention Module (FCSSAM), to highlight the specific spatial regions of relevant channels while removing the irrelevant channels of the extracted features by the backbone. We evaluated the proposed approach on a publicly available chest X-ray dataset, using binary and multi-class classification setups. Our proposed method achieves accuracy rates of 97.15\% and 79.79\% for the binary and multi-class classification setups, respectively. The results of our proposed method are superior to state-of-the-art (SOTA) methods. The code of the proposed model will be available at: https://github.com/AyushRoy2001/FA-Net.

arxiv情報

著者 Ayush Roy,Anurag Bhattacharjee,Diego Oliva,Oscar Ramos-Soto,Francisco J. Alvarez-Padilla,Ram Sarkar
発行日 2024-06-21 13:08:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク