Zero-shot 3D Segmentation of Abdominal Organs in CT Scans Using Segment Anything Model 2: Adapting Video Tracking Capabilities for 3D Medical Imaging

要約

目的: この研究は、体積医療画像のビデオ追跡機能を活用して、CT スキャンにおける腹部臓器の 3D セグメンテーションにおけるセグメント エニシング モデル 2 (SAM 2) のゼロショット パフォーマンスを評価することを目的としました。
材料と方法: 8 つの異なる施設からの TotalSegmentator CT データセット (n=123) のサブセットを使用して、8 つの腹部臓器をセグメント化する SAM 2 の能力を評価しました。
セグメンテーションは、各臓器の 3 つの異なる Z 座標レベル (尾部、中部、頭蓋レベル) から開始されました。
パフォーマンスは、Dice 類似性係数 (DSC) を使用して測定されました。
また、結果を文脈化するために臓器容積も分析しました。
結果: ゼロショット アプローチとして、明確な境界を持つ大きな臓器は高いセグメンテーション パフォーマンスを示し、平均 (中央値) DSC は次のようになりました: 肝臓 0.821(0.898)、左腎臓 0.870(0.921)、右腎臓 0.862(0.935)、脾臓
0.891(0.932)。
より小さい、または明確でない構造はパフォーマンスが低いことを示しました:胆嚢 0.531(0.590)、膵臓 0.361(0.359)、副腎 0.203-0.308(0.109-0.231)。
異なる臓器のセグメンテーションの開始初期スライスに応じて、DSC の有意な差が観察されました。
体積サイズと DSC の間には中程度の正の相関が観察されました (スピアマンの rs = 0.731、尾レベルで P <.001)。 DSC は臓器内でほぼ 0 からほぼ 1.0 までの高い変動性を示し、スキャン間のセグメンテーション パフォーマンスに実質的な不一致があることを示しました。 結論: SAM 2 は、CT スキャンにおける特定の腹部臓器、特に明確な境界を持つ大きな臓器のセグメント化において、有望なゼロショット パフォーマンスを実証しました。 追加のトレーニングなしでこれまで見えなかったターゲットをセグメント化できるモデルの機能は、医療画像におけるクロスドメインの一般化の可能性を強調しています。 ただし、より小さく、あまり定義されていない構造には改善が必要です。

要約(オリジナル)

Purpose: This study aimed to evaluate the zero-shot performance of Segment Anything Model 2 (SAM 2) in 3D segmentation of abdominal organs in CT scans, leveraging its video tracking capabilities for volumetric medical imaging. Materials and Methods: Using a subset of the TotalSegmentator CT dataset (n=123) from 8 different institutions, we assessed SAM 2’s ability to segment 8 abdominal organs. Segmentation was initiated from three different Z-coordinate levels (caudal, mid, and cranial levels) of each organ. Performance was measured using the Dice similarity coefficient (DSC). We also analyzed organ volumes to contextualize the results. Results: As a zero-shot approach, larger organs with clear boundaries demonstrated high segmentation performance, with mean(median) DSCs as follows: liver 0.821(0.898), left kidney 0.870(0.921), right kidney 0.862(0.935), and spleen 0.891(0.932). Smaller or less defined structures showed lower performance: gallbladder 0.531(0.590), pancreas 0.361(0.359), and adrenal glands 0.203-0.308(0.109-0.231). Significant differences in DSC were observed depending on the starting initial slice of segmentation for different organs. A moderate positive correlation was observed between volume size and DSCs (Spearman’s rs = 0.731, P <.001 at caudal-level). DSCs exhibited high variability within organs, ranging from near 0 to almost 1.0, indicating substantial inconsistency in segmentation performance between scans. Conclusion: SAM 2 demonstrated promising zero-shot performance in segmenting certain abdominal organs in CT scans, particularly larger organs with clear boundaries. The model's ability to segment previously unseen targets without additional training highlights its potential for cross-domain generalization in medical imaging. However, improvements are needed for smaller and less defined structures.

arxiv情報

著者 Yosuke Yamagishi,Shouhei Hanaoka,Tomohiro Kikuchi,Takahiro Nakao,Yuta Nakamura,Yukihiro Nomura,Soichiro Miki,Takeharu Yoshikawa,Osamu Abe
発行日 2024-08-12 14:16:10+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, eess.IV パーマリンク