CheXmask: a large-scale dataset of anatomical segmentation masks for multi-center chest x-ray images

要約

胸部 X 線分析用の人工知能モデルの開発に成功するには、高品質の注釈が付けられた大規模で多様なデータセットが必要です。
胸部 X 線画像のデータベースがいくつかリリースされていますが、そのほとんどには疾患診断ラベルが含まれていますが、詳細なピクセル レベルの解剖学的セグメンテーション ラベルがありません。
このギャップに対処するために、CANDID-PTX、ChestX-ray8、Chexpert、MIMIC の 6 つのよく知られた公開データベースから取得した画像に、均一かつ細粒の解剖学的注釈を付けた広範な胸部 X 線多施設セグメンテーション データセットを導入します。
CXR-JPG、Padchest、および VinDr-CXR では、676,803 のセグメンテーション マスクが生成されます。
私たちの方法論では、HybridGNet モデルを利用して、すべてのデータセットにわたって一貫した高品質のセグメンテーションを保証します。
得られたマスクを検証するために、医師の専門家の評価や自動品質管理を含む厳格な検証が実施されました。
さらに、マスクごとに個別の品質インデックスとデータセットごとの全体的な品質推定を提供します。
このデータセットは、より広範な科学コミュニティにとって貴重なリソースとして機能し、胸部 X 線分析における革新的な方法論の開発と評価を合理化します。
CheXmask データセットは、https://physionet.org/content/chexmask-cxr-segmentation-data/ で公開されています。

要約(オリジナル)

The development of successful artificial intelligence models for chest X-ray analysis relies on large, diverse datasets with high-quality annotations. While several databases of chest X-ray images have been released, most include disease diagnosis labels but lack detailed pixel-level anatomical segmentation labels. To address this gap, we introduce an extensive chest X-ray multi-center segmentation dataset with uniform and fine-grain anatomical annotations for images coming from six well-known publicly available databases: CANDID-PTX, ChestX-ray8, Chexpert, MIMIC-CXR-JPG, Padchest, and VinDr-CXR, resulting in 676,803 segmentation masks. Our methodology utilizes the HybridGNet model to ensure consistent and high-quality segmentations across all datasets. Rigorous validation, including expert physician evaluation and automatic quality control, was conducted to validate the resulting masks. Additionally, we provide individualized quality indices per mask and an overall quality estimation per dataset. This dataset serves as a valuable resource for the broader scientific community, streamlining the development and assessment of innovative methodologies in chest X-ray analysis. The CheXmask dataset is publicly available at: https://physionet.org/content/chexmask-cxr-segmentation-data/

arxiv情報

著者 Nicolás Gaggion,Candelaria Mosquera,Lucas Mansilla,Martina Aineseder,Diego H. Milone,Enzo Ferrante
発行日 2023-10-12 17:25:26+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, physics.med-ph パーマリンク