要約
高用量レート(HDR)ブラチセラピーは、局所的に進行した子宮頸がんの治療において重要な役割を果たしますが、手動での治療計画の専門知識に大きく依存しています。
この研究の目的は、強化学習(RL)と用量ベースの最適化を統合して、一貫性と効率を改善して臨床的に許容可能な治療計画を生成する完全に自動化されたHDR Brachytherapy計画フレームワークを開発することです。
階層的な2段階のオートプランニングフレームワークを提案します。
最初の段階では、ディープQネットワーク(DQN)ベースのRLエージェントが治療計画パラメーター(TPP)を繰り返し選択します。これは、ターゲットカバレッジとリスク(OAR)スパーリングの間のトレードオフを制御します。
エージェントの状態表現には、用量容積ヒストグラム(DVH)メトリックと現在のTPP値の両方が含まれ、その報酬関数には、臨床用量の目的と標的のD90、V150、V200を含む安全上の制約、および関連するすべてのOAR(bladder、rectum、sigmoid、small bowel、および大弓)のD2CCが組み込まれています。
第2段階では、カスタマイズされたAdamベースのオプティマイザーが、臨床的に情報に基づいた損失関数を使用して、選択したTPPの対応する滞留時間分布を計算します。
このフレームワークは、複雑なアプリケーターの幾何学を持つ患者のコホートで評価されました。
提案されたフレームワークは、多様な患者の解剖学にわたって臨床的に意味のあるTPP調整を成功裏に学習しました。
目に見えない検査患者の場合、RLベースの自動計画方法は平均スコア93.89%を達成し、平均91.86%の臨床計画を上回りました。
これらの発見は、ほとんどの場合、完全なターゲットカバレッジを維持し、CTVホットスポットを減らしながらスコアの改善が達成されたことを考えると注目に値します。
要約(オリジナル)
High-dose-rate (HDR) brachytherapy plays a critical role in the treatment of locally advanced cervical cancer but remains highly dependent on manual treatment planning expertise. The objective of this study is to develop a fully automated HDR brachytherapy planning framework that integrates reinforcement learning (RL) and dose-based optimization to generate clinically acceptable treatment plans with improved consistency and efficiency. We propose a hierarchical two-stage autoplanning framework. In the first stage, a deep Q-network (DQN)-based RL agent iteratively selects treatment planning parameters (TPPs), which control the trade-offs between target coverage and organ-at-risk (OAR) sparing. The agent’s state representation includes both dose-volume histogram (DVH) metrics and current TPP values, while its reward function incorporates clinical dose objectives and safety constraints, including D90, V150, V200 for targets, and D2cc for all relevant OARs (bladder, rectum, sigmoid, small bowel, and large bowel). In the second stage, a customized Adam-based optimizer computes the corresponding dwell time distribution for the selected TPPs using a clinically informed loss function. The framework was evaluated on a cohort of patients with complex applicator geometries. The proposed framework successfully learned clinically meaningful TPP adjustments across diverse patient anatomies. For the unseen test patients, the RL-based automated planning method achieved an average score of 93.89%, outperforming the clinical plans which averaged 91.86%. These findings are notable given that score improvements were achieved while maintaining full target coverage and reducing CTV hot spots in most cases.
arxiv情報
著者 | Mohammadamin Moradi,Runyu Jiang,Yingzi Liu,Malvern Madondo,Tianming Wu,James J. Sohn,Xiaofeng Yang,Yasmin Hasan,Zhen Tian |
発行日 | 2025-06-13 17:07:30+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google