Deep learning automated quantification of lung disease in pulmonary hypertension on CT pulmonary angiography: A preliminary clinical study with external validation

要約

目的: 前毛細血管性肺高血圧症 (PH) における肺疾患の評価は、適切な患者管理に不可欠です。
この研究は、CT 肺血管造影 (CTPA) における肺組織分類のための人工知能 (AI) 深層学習モデルを開発し、臨床評価方法との相関を評価することを目的としています。
材料と方法: 外部検証を伴うこのレトロスペクティブ研究では、前毛細血管 PH の 122 人の患者がトレーニング (n=83)、検証 (n=17)、およびテスト (n=10 内部テスト、n=12 外部テスト) に使用されました。
パッチベースの DenseNet-121 分類モデル。
「正常」、「すりガラス」、「網目状のすりガラス」、「ハニカム」、および「肺気腫」は、フライシュナー協会の用語集に従って分類されました。
グラウンド トゥルース ク​​ラスは、ラベル付けされた領域から抽出されたパッチを使用して、2 人の放射線科医によって分割されました。
各テクスチャの肺容積の割合は、肺実質全体にわたる粗いテクスチャ分類マッピングを生成するために、肺容積全体にわたってパッチを分類することによって計算されました。
AI 出力は、一酸化炭素 (DLCO) の拡散能力に対して評価され、専門の放射線科医が疾患の重症度を報告しました。
結果: 検証、内部テスト、および外部テストのマイクロ平均 AUC は、それぞれ 0.92、0.95、および 0.94 でした。
このモデルは、実質テクスチャ全体で一貫した性能を発揮し、一酸化炭素の拡散能力 (DLCO) との強い相関関係を示し、専門の放射線科医によって報告された疾患の重症度との良好な対応を示しました。
結論: 分類モデルは、外部検証で優れたパフォーマンスを発揮します。
その出力の臨床的有用性が実証されています。
この客観的で反復可能な疾患重症度の測定は、放射線学的報告に付随する患者管理に役立ちます。

要約(オリジナル)

Purpose: Lung disease assessment in precapillary pulmonary hypertension (PH) is essential for appropriate patient management. This study aims to develop an artificial intelligence (AI) deep learning model for lung texture classification in CT Pulmonary Angiography (CTPA), and evaluate its correlation with clinical assessment methods. Materials and Methods: In this retrospective study with external validation, 122 patients with pre-capillary PH were used to train (n=83), validate (n=17) and test (n=10 internal test, n=12 external test) a patch based DenseNet-121 classification model. ‘Normal’, ‘Ground glass’, ‘Ground glass with reticulation’, ‘Honeycombing’, and ‘Emphysema’ were classified as per the Fleishner Society glossary of terms. Ground truth classes were segmented by two radiologists with patches extracted from the labelled regions. Proportion of lung volume for each texture was calculated by classifying patches throughout the entire lung volume to generate a coarse texture classification mapping throughout the lung parenchyma. AI output was assessed against diffusing capacity of carbon monoxide (DLCO) and specialist radiologist reported disease severity. Results: Micro-average AUCs for the validation, internal test, and external test were 0.92, 0.95, and 0.94, respectively. The model had consistent performance across parenchymal textures, demonstrated strong correlation with diffusing capacity of carbon monoxide (DLCO), and showed good correspondence with disease severity reported by specialist radiologists. Conclusion: The classification model demonstrates excellent performance on external validation. The clinical utility of its output has been demonstrated. This objective, repeatable measure of disease severity can aid in patient management in adjunct to radiological reporting.

arxiv情報

著者 Michael J. Sharkey,Krit Dwivedi,Samer Alabed,Andrew J. Swift
発行日 2023-03-20 14:06:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, eess.IV パーマリンク