要約
入院を必要とする患者が大量に蓄積したため、COVID-19 パンデミック病は、先進国でさえ、医療システムに大きな過負荷を引き起こしました。
医用画像データに基づく深層学習技術は、COVID-19 の症例をより迅速に検出し、病気の進行を監視するのに役立ちます。
肺の X 線に関する多数のソリューションが提案されていますが、いずれも臨床で使用できる製品ではありません。
5 つの異なるデータセット (POLCOVID、AIforCOVID、COVIDx、NIH、および人工的に生成されたデータ) を使用して、モデル トレーニング用の 23 799 CXR の代表的なデータセットを構築しました。
1 050 枚の画像をホールドアウト テスト セットとして使用し、44 247 枚を独立したテスト セット (BIMCV データベース) として使用しました。
CXR の臨床的に関連する領域を特定するために、U-Net ベースのモデルが開発されました。
各画像クラス (正常、肺炎、COVID-19) は、2D ガウス混合モデルを使用して 3 つのサブタイプに分割されました。
ディシジョン ツリーを使用して、処理された CXR に基づく InceptionV3 ネットワークからの予測と、ラジオミクス機能に関する高密度ニューラル ネットワークが使用されました。
肺セグメンテーション モデルは、検証データセットで 94.86%、テスト データセットで 93.36% の Sorensen-Dice 係数を与えました。
5 分割交差検証では、すべてのクラスの精度は 91% から 93% の範囲で、特異度は感度よりもわずかに高く、NPV は PPV よりもわずかに高くなりました。
ホールドアウト テスト セットでは、バランスの取れた精度は 68% から 100% の範囲でした。
サブタイプ N1、P1、および C1 で最高のパフォーマンスが得られました。
通常およびCOVID-19クラスのサブタイプの独立したデータセットで同様のパフォーマンスが得られました。
正常なケースとして誤って分類された COVID-19 患者の 76% は、放射線科医によって病気の兆候がないと注釈が付けられました。
最後に、迅速な診断サポート ツールへのアクセスを提供するオンライン サービス (https://circa.aei.polsl.pl) を開発しました。
要約(オリジナル)
Due to the large accumulation of patients requiring hospitalization, the COVID-19 pandemic disease caused a high overload of health systems, even in developed countries. Deep learning techniques based on medical imaging data can help in the faster detection of COVID-19 cases and monitoring of disease progression. Regardless of the numerous proposed solutions for lung X-rays, none of them is a product that can be used in the clinic. Five different datasets (POLCOVID, AIforCOVID, COVIDx, NIH, and artificially generated data) were used to construct a representative dataset of 23 799 CXRs for model training; 1 050 images were used as a hold-out test set, and 44 247 as independent test set (BIMCV database). A U-Net-based model was developed to identify a clinically relevant region of the CXR. Each image class (normal, pneumonia, and COVID-19) was divided into 3 subtypes using a 2D Gaussian mixture model. A decision tree was used to aggregate predictions from the InceptionV3 network based on processed CXRs and a dense neural network on radiomic features. The lung segmentation model gave the Sorensen-Dice coefficient of 94.86% in the validation dataset, and 93.36% in the testing dataset. In 5-fold cross-validation, the accuracy for all classes ranged from 91% to 93%, keeping slightly higher specificity than sensitivity and NPV than PPV. In the hold-out test set, the balanced accuracy ranged between 68% and 100%. The highest performance was obtained for the subtypes N1, P1, and C1. A similar performance was obtained on the independent dataset for normal and COVID-19 class subtypes. Seventy-six percent of COVID-19 patients wrongly classified as normal cases were annotated by radiologists as with no signs of disease. Finally, we developed the online service (https://circa.aei.polsl.pl) to provide access to fast diagnosis support tools.
arxiv情報
著者 | Wojciech Prazuch,Aleksandra Suwalska,Marek Socha,Joanna Tobiasz,Pawel Foszner,Jerzy Jaroszewicz,Katarzyna Gruszczynska,Magdalena Sliwinska,Jerzy Walecki,Tadeusz Popiela,Grzegorz Przybylski,Andrzej Cieszanowski,Mateusz Nowak,Malgorzata Pawlowska,Robert Flisiak,Krzysztof Simon,Gabriela Zapolska,Barbara Gizycka,Edyta Szurowska,POLCOVID Study Group,Michal Marczyk,Joanna Polanska |
発行日 | 2022-10-11 13:30:34+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google