CIRCA: comprehensible online system in support of chest X-rays-based COVID-19 diagnosis

要約

入院を必要とする患者が大量に蓄積したため、COVID-19 パンデミック病は、先進国でさえ、医療システムに大きな過負荷を引き起こしました。
医用画像データに基づく深層学習技術は、COVID-19 の症例をより迅速に検出し、病気の進行を監視するのに役立ちます。
肺の X 線に関する多数のソリューションが提案されていますが、いずれも臨床で使用できる製品ではありません。
5 つの異なるデータセット (POLCOVID、AIforCOVID、COVIDx、NIH、および人工的に生成されたデータ) を使用して、モデル トレーニング用の 23 799 CXR の代表的なデータセットを構築しました。
1 050 枚の画像をホールドアウト テスト セットとして使用し、44 247 枚を独立したテスト セット (BIMCV データベース) として使用しました。
CXR の臨床的に関連する領域を特定するために、U-Net ベースのモデルが開発されました。
各画像クラス (正常、肺炎、COVID-19) は、2D ガウス混合モデルを使用して 3 つのサブタイプに分割されました。
ディシジョン ツリーを使用して、処理された CXR に基づく InceptionV3 ネットワークからの予測と、ラジオミクス機能に関する高密度ニューラル ネットワークが使用されました。
肺セグメンテーション モデルは、検証データセットで 94.86%、テスト データセットで 93.36% の Sorensen-Dice 係数を与えました。
5 分割交差検証では、すべてのクラスの精度は 91% から 93% の範囲で、特異度は感度よりもわずかに高く、NPV は PPV よりもわずかに高くなりました。
ホールドアウト テスト セットでは、バランスの取れた精度は 68% から 100% の範囲でした。
サブタイプ N1、P1、および C1 で最高のパフォーマンスが得られました。
通常およびCOVID-19クラスのサブタイプの独立したデータセットで同様のパフォーマンスが得られました。
正常なケースとして誤って分類された COVID-19 患者の 76% は、放射線科医によって病気の兆候がないと注釈が付けられました。
最後に、迅速な診断サポート ツールへのアクセスを提供するオンライン サービス (https://circa.aei.polsl.pl) を開発しました。

要約(オリジナル)

Due to the large accumulation of patients requiring hospitalization, the COVID-19 pandemic disease caused a high overload of health systems, even in developed countries. Deep learning techniques based on medical imaging data can help in the faster detection of COVID-19 cases and monitoring of disease progression. Regardless of the numerous proposed solutions for lung X-rays, none of them is a product that can be used in the clinic. Five different datasets (POLCOVID, AIforCOVID, COVIDx, NIH, and artificially generated data) were used to construct a representative dataset of 23 799 CXRs for model training; 1 050 images were used as a hold-out test set, and 44 247 as independent test set (BIMCV database). A U-Net-based model was developed to identify a clinically relevant region of the CXR. Each image class (normal, pneumonia, and COVID-19) was divided into 3 subtypes using a 2D Gaussian mixture model. A decision tree was used to aggregate predictions from the InceptionV3 network based on processed CXRs and a dense neural network on radiomic features. The lung segmentation model gave the Sorensen-Dice coefficient of 94.86% in the validation dataset, and 93.36% in the testing dataset. In 5-fold cross-validation, the accuracy for all classes ranged from 91% to 93%, keeping slightly higher specificity than sensitivity and NPV than PPV. In the hold-out test set, the balanced accuracy ranged between 68% and 100%. The highest performance was obtained for the subtypes N1, P1, and C1. A similar performance was obtained on the independent dataset for normal and COVID-19 class subtypes. Seventy-six percent of COVID-19 patients wrongly classified as normal cases were annotated by radiologists as with no signs of disease. Finally, we developed the online service (https://circa.aei.polsl.pl) to provide access to fast diagnosis support tools.

arxiv情報

著者 Wojciech Prazuch,Aleksandra Suwalska,Marek Socha,Joanna Tobiasz,Pawel Foszner,Jerzy Jaroszewicz,Katarzyna Gruszczynska,Magdalena Sliwinska,Jerzy Walecki,Tadeusz Popiela,Grzegorz Przybylski,Andrzej Cieszanowski,Mateusz Nowak,Malgorzata Pawlowska,Robert Flisiak,Krzysztof Simon,Gabriela Zapolska,Barbara Gizycka,Edyta Szurowska,POLCOVID Study Group,Michal Marczyk,Joanna Polanska
発行日 2022-10-11 13:30:34+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク