要約
コンピュータ断層撮影(CT)は,RT-PCR検査を補完するCOVID-19スクリーニングおよび評価ツールとして広く検討されている.CTを用いたCOVID-19スクリーニングを放射線科医に支援するために,多くのコンピュータ支援システムが提案されている.しかし,提案されているシステムの多くは,量と多様性の両面で制限のあるCTデータを用いて構築されている.機械学習を用いたスクリーニングシステムの開発を支援するために,胸部CT画像からCOVID-19症例を検出するための大規模な多国籍ベンチマークデータセットであるCOVIDx CT-3を紹介する.COVIDx CT-3は、少なくとも17カ国にわたる6,068人の患者からの431,205枚のCTスライスを含み、我々の知る限り、オープンアクセス形式のCOVID-19 CT画像の最大かつ最も多様なデータセットである。さらに、COVIDx CT-3データセットのデータの多様性と潜在的な偏りを検証し、様々なソースからデータをキュレートする努力にもかかわらず、著しい地理的およびクラス不均衡が残っていることを発見しました。
要約(オリジナル)
Computed tomography (CT) has been widely explored as a COVID-19 screening and assessment tool to complement RT-PCR testing. To assist radiologists with CT-based COVID-19 screening, a number of computer-aided systems have been proposed; however, many proposed systems are built using CT data which is limited in both quantity and diversity. Motivated to support efforts in the development of machine learning-driven screening systems, we introduce COVIDx CT-3, a large-scale multinational benchmark dataset for detection of COVID-19 cases from chest CT images. COVIDx CT-3 includes 431,205 CT slices from 6,068 patients across at least 17 countries, which to the best of our knowledge represents the largest, most diverse dataset of COVID-19 CT images in open-access form. Additionally, we examine the data diversity and potential biases of the COVIDx CT-3 dataset, finding that significant geographic and class imbalances remain despite efforts to curate data from a wide variety of sources.
arxiv情報
著者 | Tia Tuinstra,Hayden Gunraj,Alexander Wong |
発行日 | 2022-06-07 06:35:48+00:00 |
arxivサイト | arxiv_id(pdf) |