CheXmask: a large-scale dataset of anatomical segmentation masks for multi-center chest x-ray images

要約

胸部 X 線分析用の人工知能モデルの開発に成功するには、高品質のアノテーションを備えた大規模で多様なデータセットが必要です。
胸部 X 線画像のデータベースがいくつかリリースされていますが、そのほとんどには疾患診断ラベルが含まれていますが、詳細なピクセル レベルの解剖学的セグメンテーション ラベルがありません。
このギャップに対処するために、私たちは、5 つのよく知られた公開データベース (ChestX-ray8、Chexpert、MIMIC-CXR-JPG、
Padchest および VinDr-CXR を使用すると、657,566 個のセグメンテーション マスクが得られます。
私たちの方法論では、HybridGNet モデルを利用して、すべてのデータセットにわたって一貫した高品質のセグメンテーションを保証します。
得られたマスクを検証するために、医師の専門家の評価や自動品質管理などの厳格な検証が実施されました。
さらに、マスクごとに個別の品質インデックスとデータセットごとの全体的な品質推定を提供します。
このデータセットは、より広範な科学コミュニティにとって貴重なリソースとして機能し、胸部 X 線分析における革新的な方法論の開発と評価を合理化します。
CheXmask データセットは、https://physionet.org/content/chexmask-cxr-segmentation-data/ で公開されています。

要約(オリジナル)

The development of successful artificial intelligence models for chest X-ray analysis relies on large, diverse datasets with high-quality annotations. While several databases of chest X-ray images have been released, most include disease diagnosis labels but lack detailed pixel-level anatomical segmentation labels. To address this gap, we introduce an extensive chest X-ray multi-center segmentation dataset with uniform and fine-grain anatomical annotations for images coming from five well-known publicly available databases: ChestX-ray8, Chexpert, MIMIC-CXR-JPG, Padchest, and VinDr-CXR, resulting in 657,566 segmentation masks. Our methodology utilizes the HybridGNet model to ensure consistent and high-quality segmentations across all datasets. Rigorous validation, including expert physician evaluation and automatic quality control, was conducted to validate the resulting masks. Additionally, we provide individualized quality indices per mask and an overall quality estimation per dataset. This dataset serves as a valuable resource for the broader scientific community, streamlining the development and assessment of innovative methodologies in chest X-ray analysis. The CheXmask dataset is publicly available at: https://physionet.org/content/chexmask-cxr-segmentation-data/

arxiv情報

著者 Nicolás Gaggion,Candelaria Mosquera,Lucas Mansilla,Julia Mariel Saidman,Martina Aineseder,Diego H. Milone,Enzo Ferrante
発行日 2024-05-14 14:14:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV, physics.med-ph パーマリンク