COVIDx CXR-4: An Expanded Multi-Institutional Open-Source Benchmark Dataset for Chest X-ray Image-Based Computer-Aided COVID-19 Diagnostics

要約

新型コロナウイルス感染症(COVID-19)のパンデミックによる世界的な影響は依然として大きく、最初の発生から3年が経過した現在でも各国に持続的な圧力をかけている。
ディープラーニング モデルは、新型コロナウイルス感染症の診断改善に有望であることが示されていますが、パフォーマンスを向上させるには多様で大規模なデータセットが必要です。
この論文では、胸部 X 線画像ベースのコンピューター支援 COVID-19 診断用に拡張された複数機関のオープンソース ベンチマーク データセットである COVIDx CXR-4 を紹介します。
COVIDx CXR-4 は、患者コホートの合計サイズを 2.66 倍以上に拡大することで、以前の COVIDx CXR-3 データセットを大幅に拡張し、複数の施設にわたる 45,342 人の患者からの 84,818 枚の画像を取得します。
私たちは、患者の人口統計、画像メタデータ、疾患分布の多様性に関する広範な分析を提供し、潜在的なデータセットの偏りを明らかにします。
著者の知る限り、COVIDx CXR-4 は最大かつ最も多様なオープンソースの COVID-19 CXR データセットであり、新型コロナウイルス感染症に対する臨床医を支援する研究を推進するオープンな取り組みの一環として一般公開されています。

要約(オリジナル)

The global ramifications of the COVID-19 pandemic remain significant, exerting persistent pressure on nations even three years after its initial outbreak. Deep learning models have shown promise in improving COVID-19 diagnostics but require diverse and larger-scale datasets to improve performance. In this paper, we introduce COVIDx CXR-4, an expanded multi-institutional open-source benchmark dataset for chest X-ray image-based computer-aided COVID-19 diagnostics. COVIDx CXR-4 expands significantly on the previous COVIDx CXR-3 dataset by increasing the total patient cohort size by greater than 2.66 times, resulting in 84,818 images from 45,342 patients across multiple institutions. We provide extensive analysis on the diversity of the patient demographic, imaging metadata, and disease distributions to highlight potential dataset biases. To the best of the authors’ knowledge, COVIDx CXR-4 is the largest and most diverse open-source COVID-19 CXR dataset and is made publicly available as part of an open initiative to advance research to aid clinicians against the COVID-19 disease.

arxiv情報

著者 Yifan Wu,Hayden Gunraj,Chi-en Amy Tai,Alexander Wong
発行日 2023-11-29 14:40:31+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク