A simple and effective approach for body part recognition on CT scans based on projection estimation

要約

機械学習モデルには、最適なパフォーマンスを得るために大量の注釈付きデータが必要であることはよく知られています。
ラベル付けコンピューター断層撮影(CT)データは、その体積性がなく、しばしば欠落しているため、$/$または不完全な関連メタデータのために、特に困難な作業になる可能性があります。
1つのCTスキャンを検査しても、追加のコンピューターソフトウェア、またはプログラミング言語の場合は、$-$追加プログラミングライブラリが必要です。
この研究では、身体領域の識別のための3D CTスキャンの2D X線様の推定に基づいて、シンプルで効果的なアプローチを提案しています。
体領域は一般にCTスキャンに関連付けられていますが、観察されたCTに存在する他の解剖学的領域を無視する集中的な主要な体領域のみを記述します。
提案されたアプローチでは、推定2D画像が14の異なるボディ領域を特定するために使用され、高品質の医療データセットを構築するための貴重な情報を提供しました。
提案された方法の有効性を評価するために、2.5D、3D、およびFoundationモデル(MI2)ベースのアプローチと比較しました。
私たちのアプローチは、他のアプローチを上回り、0.840 $ \ PM $ 0.114(2.5Dデンセネット-161)、0.854 $ 0.096(3D voxCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCCRINET-161)と比較して、統計的有意性とF1スコアが統計的有意性とF1スコアを上回りました。
(MI2ファンデーションモデル)。
使用されたデータセットは3つの異なる臨床センターで構成され、15,622 CTスキャン(44,135ラベル)をカウントしました。

要約(オリジナル)

It is well known that machine learning models require a high amount of annotated data to obtain optimal performance. Labelling Computed Tomography (CT) data can be a particularly challenging task due to its volumetric nature and often missing and$/$or incomplete associated meta-data. Even inspecting one CT scan requires additional computer software, or in the case of programming languages $-$ additional programming libraries. This study proposes a simple, yet effective approach based on 2D X-ray-like estimation of 3D CT scans for body region identification. Although body region is commonly associated with the CT scan, it often describes only the focused major body region neglecting other anatomical regions present in the observed CT. In the proposed approach, estimated 2D images were utilized to identify 14 distinct body regions, providing valuable information for constructing a high-quality medical dataset. To evaluate the effectiveness of the proposed method, it was compared against 2.5D, 3D and foundation model (MI2) based approaches. Our approach outperformed the others, where it came on top with statistical significance and F1-Score for the best-performing model EffNet-B0 of 0.980 $\pm$ 0.016 in comparison to the 0.840 $\pm$ 0.114 (2.5D DenseNet-161), 0.854 $\pm$ 0.096 (3D VoxCNN), and 0.852 $\pm$ 0.104 (MI2 foundation model). The utilized dataset comprised three different clinical centers and counted 15,622 CT scans (44,135 labels).

arxiv情報

著者 Franko Hrzic,Mohammadreza Movahhedi,Ophelie Lavoie-Gagne,Ata Kiapour
発行日 2025-04-30 17:13:44+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 65D19, 68T01, cs.CV, I.2.1 パーマリンク