Reason Like a Radiologist: Chain-of-Thought and Reinforcement Learning for Verifiable Report Generation

要約

放射線科レポートの生成は効率に重要ですが、現在のモデルには専門家の構造化された推論が欠けており、視覚的発見を正確な解剖学的位置にリンクできないことにより、臨床的信頼と説明性を妨げます。
このペーパーでは、空間的に検証可能で説明可能な放射線学レポートを生成するための画期的な統一トレーニングフレームワークであるBoxMed-RLを紹介します。
大規模なビジョン言語モデルに基づいて構築されたBoxMed-RLは、2つの統合されたフェーズを通じてレポート生成に革命をもたらします。(1)前提条件でモデルを洗練し、チェーンオブサブの監督を使用して放射線科医のようなワークフローを内面化し、その後に空間的に検証可能な補強材を内部化します。
(2)下流のアダプターフェーズでは、前提条件の重みを凍結し、下流のアダプターを訓練して、流fluentで臨床的に信頼できるレポートを確保します。
このフレームワークは、放射線科医のワークフローを正確に模倣しており、モデルに高レベルの医療概念を決定的な解剖学的証拠と結びつけることを強要しています。
パブリックデータセットでの広範な実験では、BoxMed-RLが最新の方法と比較して流星とRouge-Lの両方のメトリックの平均7%の改善を達成することを示しています。
大規模な言語モデルベースのメトリックの平均5%の改善は、高品質の放射線レポートを生成する際にBoxmed-RLの堅牢性をさらに強調しています。

要約(オリジナル)

Radiology report generation is critical for efficiency but current models lack the structured reasoning of experts, hindering clinical trust and explainability by failing to link visual findings to precise anatomical locations. This paper introduces BoxMed-RL, a groundbreaking unified training framework for generating spatially verifiable and explainable radiology reports. Built on a large vision-language model, BoxMed-RL revolutionizes report generation through two integrated phases: (1) In the Pretraining Phase, we refine the model via medical concept learning, using Chain-of-Thought supervision to internalize the radiologist-like workflow, followed by spatially verifiable reinforcement, which applies reinforcement learning to align medical findings with bounding boxes. (2) In the Downstream Adapter Phase, we freeze the pretrained weights and train a downstream adapter to ensure fluent and clinically credible reports. This framework precisely mimics radiologists’ workflow, compelling the model to connect high-level medical concepts with definitive anatomical evidence. Extensive experiments on public datasets demonstrate that BoxMed-RL achieves an average 7% improvement in both METEOR and ROUGE-L metrics compared to state-of-the-art methods. An average 5% improvement in large language model-based metrics further underscores BoxMed-RL’s robustness in generating high-quality radiology reports.

arxiv情報

著者 Peiyuan Jing,Kinhei Lee,Zhenxuan Zhang,Huichi Zhou,Zhengqing Yuan,Zhifan Gao,Lei Zhu,Giorgos Papanastasiou,Yingying Fang,Guang Yang
発行日 2025-04-25 16:05:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク