COVIDx CT-3: A Large-scale, Multinational, Open-Source Benchmark Dataset for Computer-aided COVID-19 Screening from Chest CT Images

要約

コンピュータ断層撮影 (CT) は、RT-PCR 検査を補完する COVID-19 のスクリーニングおよび評価ツールとして広く研究されています。
CT ベースの COVID-19 スクリーニングで放射線科医を支援するために、多くのコンピューター支援システムが提案されています。
しかし、多くの提案されたシステムは、量と多様性の両方で制限された CT データを使用して構築されます。
機械学習によるスクリーニング システムの開発を支援するために、胸部 CT 画像から COVID-19 症例を検出するための大規模な多国籍ベンチマーク データセットである COVIDx CT-3 を紹介します。
COVIDx CT-3 には、少なくとも 17 か国の 6,068 人の患者からの 431,205 枚の CT スライスが含まれており、これは私たちの知る限り、オープンアクセス形式の COVID-19 CT 画像の最大かつ最も多様なデータセットを表しています。
さらに、COVIDx CT-3 データセットのデータの多様性と潜在的なバイアスを調査し、さまざまなソースからデータをキュレーションする努力にもかかわらず、地理的およびクラスの大きな不均衡が残っていることを発見しました。

要約(オリジナル)

Computed tomography (CT) has been widely explored as a COVID-19 screening and assessment tool to complement RT-PCR testing. To assist radiologists with CT-based COVID-19 screening, a number of computer-aided systems have been proposed. However, many proposed systems are built using CT data which is limited in both quantity and diversity. Motivated to support efforts in the development of machine learning-driven screening systems, we introduce COVIDx CT-3, a large-scale multinational benchmark dataset for detection of COVID-19 cases from chest CT images. COVIDx CT-3 includes 431,205 CT slices from 6,068 patients across at least 17 countries, which to the best of our knowledge represents the largest, most diverse dataset of COVID-19 CT images in open-access form. Additionally, we examine the data diversity and potential biases of the COVIDx CT-3 dataset, finding that significant geographic and class imbalances remain despite efforts to curate data from a wide variety of sources.

arxiv情報

著者 Hayden Gunraj,Tia Tuinstra,Alexander Wong
発行日 2022-11-16 13:09:28+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク