要約
癌は異常な成長であり、局所的に侵入し、遠い臓器に転移する可能性があります。
放射線療法治療計画の最適化には、腫瘍と周囲の正常組織の正確な自己セグメント化が必要です。
最近のAIベースのセグメンテーションモデルは、一般に、地元の患者集団の不均一性を欠いている大規模な公共データセットでトレーニングされています。
これらの研究はAIベースの医療画像のセグメンテーションを進めていますが、AI腫瘍セグメンテーションモデルを病院ソフトウェアに直接開発および統合して、効率的かつ正確な腫瘍学的治療計画と実行には、ローカルデータセットの研究が必要です。
この研究は、厳格なプライバシー保護の下で地元の病院から取得した磁気共鳴画像(MRI)データセットでの計算効率の高いハイブリッドUNETトランスフォーマーモデルを使用した腫瘍のセグメンテーションを強化します。
シームレスなDICOM抽出と前処理のための堅牢なデータパイプラインを開発し、その後、多様な臨床設定全体でモデルの一般化を確保するために広範な画像増強を行い、トレーニング用の6080枚の画像の合計データセットをもたらしました。
当社の新しいアーキテクチャは、UNETベースの畳み込みニューラルネットワークを、効率的な注意、スクイーズアンドエクスチャテーション(SE)ブロック、畳み込みブロック注意モジュール(CBAM)、および再接続ブロックを含む、変圧器ボトルネットと補完的な注意モジュールと統合しています。
収束を加速して計算需要を減らすために、最大バッチサイズ8を使用し、前提条件のイメージネット重量でエンコーダを初期化し、Kaggleのランタイム制限を克服するためにチェックポイントを介してデュアルNVIDIA T4 GPUのモデルをトレーニングしました。
ローカルMRIデータセットの定量的評価により、0.764のサイコロ類似性係数と0.736の交差点(IOU)が得られ、データが限られているにもかかわらず競争力のあるパフォーマンスを実証し、臨床展開のためのサイト固有のモデル開発の重要性を強調しました。
要約(オリジナル)
Cancer is an abnormal growth with potential to invade locally and metastasize to distant organs. Accurate auto-segmentation of the tumor and surrounding normal tissues is required for radiotherapy treatment plan optimization. Recent AI-based segmentation models are generally trained on large public datasets, which lack the heterogeneity of local patient populations. While these studies advance AI-based medical image segmentation, research on local datasets is necessary to develop and integrate AI tumor segmentation models directly into hospital software for efficient and accurate oncology treatment planning and execution. This study enhances tumor segmentation using computationally efficient hybrid UNet-Transformer models on magnetic resonance imaging (MRI) datasets acquired from a local hospital under strict privacy protection. We developed a robust data pipeline for seamless DICOM extraction and preprocessing, followed by extensive image augmentation to ensure model generalization across diverse clinical settings, resulting in a total dataset of 6080 images for training. Our novel architecture integrates UNet-based convolutional neural networks with a transformer bottleneck and complementary attention modules, including efficient attention, Squeeze-and-Excitation (SE) blocks, Convolutional Block Attention Module (CBAM), and ResNeXt blocks. To accelerate convergence and reduce computational demands, we used a maximum batch size of 8 and initialized the encoder with pretrained ImageNet weights, training the model on dual NVIDIA T4 GPUs via checkpointing to overcome Kaggle’s runtime limits. Quantitative evaluation on the local MRI dataset yielded a Dice similarity coefficient of 0.764 and an Intersection over Union (IoU) of 0.736, demonstrating competitive performance despite limited data and underscoring the importance of site-specific model development for clinical deployment.
arxiv情報
著者 | Syed Haider Ali,Asrar Ahmad,Muhammad Ali,Asifullah Khan,Muhammad Shahban,Nadeem Shaukat |
発行日 | 2025-06-18 15:36:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google