FA-Net: A Fuzzy Attention-aided Deep Neural Network for Pneumonia Detection in Chest X-Rays


胸部 X 線画像検査は、肺炎の診断に最も一般的に使用される方法です。
しかし、胸部 X 線の視覚的検査は難しく、主観的なものになる場合があります。
バイナリ クラス (肺炎と正常) 分類タスクとマルチクラス (細菌性肺炎、ウイルス性肺炎、正常) 分類タスクのバックボーンとして、DenseNet-121 と ResNet50 をそれぞれ使用しました。
また、ファジー チャネル選択的空間アテンション モジュール (FCSSAM) と呼ばれるチャネル固有の空間アテンション メカニズムを実装し、バックボーンによって抽出された特徴の無関係なチャネルを削除しながら、関連するチャネルの特定の空間領域を強調表示します。
私たちは、バイナリおよびマルチクラス分類設定を使用して、公的に入手可能な胸部 X 線データセットで提案されたアプローチを評価しました。
私たちが提案した方法は、バイナリ分類セットアップとマルチクラス分類セットアップでそれぞれ 97.15\% と 79.79\% の精度率を達成しました。
私たちが提案した方法の結果は、最先端の (SOTA) 方法よりも優れています。
提案されたモデルのコードは、https://github.com/AyushRoy2001/FA-Net から入手できます。


Pneumonia is a respiratory infection caused by bacteria, fungi, or viruses. It affects many people, particularly those in developing or underdeveloped nations with high pollution levels, unhygienic living conditions, overcrowding, and insufficient medical infrastructure. Pneumonia can cause pleural effusion, where fluids fill the lungs, leading to respiratory difficulty. Early diagnosis is crucial to ensure effective treatment and increase survival rates. Chest X-ray imaging is the most commonly used method for diagnosing pneumonia. However, visual examination of chest X-rays can be difficult and subjective. In this study, we have developed a computer-aided diagnosis system for automatic pneumonia detection using chest X-ray images. We have used DenseNet-121 and ResNet50 as the backbone for the binary class (pneumonia and normal) and multi-class (bacterial pneumonia, viral pneumonia, and normal) classification tasks, respectively. We have also implemented a channel-specific spatial attention mechanism, called Fuzzy Channel Selective Spatial Attention Module (FCSSAM), to highlight the specific spatial regions of relevant channels while removing the irrelevant channels of the extracted features by the backbone. We evaluated the proposed approach on a publicly available chest X-ray dataset, using binary and multi-class classification setups. Our proposed method achieves accuracy rates of 97.15\% and 79.79\% for the binary and multi-class classification setups, respectively. The results of our proposed method are superior to state-of-the-art (SOTA) methods. The code of the proposed model will be available at: https://github.com/AyushRoy2001/FA-Net.


著者 Ayush Roy,Anurag Bhattacharjee,Diego Oliva,Oscar Ramos-Soto,Francisco J. Alvarez-Padilla,Ram Sarkar
発行日 2024-06-21 13:08:40+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV, eess.IV パーマリンク