Does image resolution impact chest X-ray based fine-grained Tuberculosis-consistent lesion segmentation?

要約

ディープラーニング(DL)モデルは、医療画像、特に胸部X線(CXR)の解剖学的関心領域(ROI)や疾患領域のセグメンテーションにおいて最先端の技術になりつつあります。しかし、これらのモデルは、計算機資源の不足を理由に、縮小された画像解像度で学習されると報告されている。特に、CXRにおける結核性病変のセグメンテーションを考慮し、研究対象のタスクに対してこれらのモデルを訓練するための最適な画像解像度を特定する文献は乏しい。本研究では、(i) 深セン結核CXRデータセットを用い、肺ROIのクロッピングとアスペクト比の調整を伴う/伴わない様々な画像/マスク解像度を用いてInception-V3ベースのUNetモデルを訓練することで得られる性能向上を調査し、 (ii) 結核関連病変セグメンテーション性能の向上のための広範な経験評価を通じて最適画像解像度を明らかにした。我々は、最適解像度での性能をさらに向上させるために、モデルスナップショットの保存、テスト時間増強(TTA)法の最適化、最適なセグメンテーション閾値の選択からなる組み合わせ的アプローチを提案した。我々は、(i)高い画像解像度は必ずしも必要ではないこと、(ii)最適な画像解像度を特定することは、研究対象のタスクに対して優れた性能を達成するために不可欠であることを強調する。

要約(オリジナル)

Deep learning (DL) models are becoming state-of-the-art in segmenting anatomical and disease regions of interest (ROIs) in medical images, particularly chest X-rays (CXRs). However, these models are reportedly trained on reduced image resolutions citing reasons for the lack of computational resources. Literature is sparse considering identifying the optimal image resolution to train these models for the task under study, particularly considering segmentation of Tuberculosis (TB)-consistent lesions in CXRs. In this study, we used the (i) Shenzhen TB CXR dataset, investigated performance gains achieved through training an Inception-V3-based UNet model using various image/mask resolutions with/without lung ROI cropping and aspect ratio adjustments, and (ii) identified the optimal image resolution through extensive empirical evaluations to improve TB-consistent lesion segmentation performance. We proposed a combinatorial approach consisting of storing model snapshots, optimizing test-time augmentation (TTA) methods, and selecting the optimal segmentation threshold to further improve performance at the optimal resolution. We emphasize that (i) higher image resolutions are not always necessary and (ii) identifying the optimal image resolution is indispensable to achieve superior performance for the task under study.

arxiv情報

著者 Sivaramakrishnan Rajaraman,Feng Yang,Ghada Zamzmi,Zhiyun Xue,Sameer Antani
発行日 2023-01-10 15:34:39+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.CV, eess.IV パーマリンク