Online Iterative Self-Alignment for Radiology Report Generation

要約

Radiology Report Generation(RRG)は、放射線科医の重いワークロードを緩和するための重要な研究トピックです。
既存のRRGモデルは、主に、放射線画像のデータペアと対応する放射線科医と発音されたレポートを使用したさまざまなモデルアーキテクチャに基づいて、監視された微調整(SFT)に依存しています。
最近の研究により、焦点はトレーニング後の改善にシフトし、RRGモデルの出力を強化学習(RL)を使用した人間の好みと調整しました。
ただし、高品質の注釈付きデータの限られたデータカバレッジは、過剰適合と一般化のリスクをもたらします。
このペーパーでは、4つの段階で構成されるRRGの新しいオンライン反復自己調整(OISA)メソッドを提案します:多様なデータの自己生成、多目的選好データの自己評価、多目的最適化のための自己調整、さらなる改善のための自己評価。
私たちのアプローチにより、特定の臨床目標に合わせて調整されたさまざまなレポートを生成し、RRGモデルの全体的なパフォーマンスを繰り返し向上させることができます。
既存の方法とは異なり、フレームワークはデータ品質を大幅に向上させ、反復的な多目的最適化によりパフォーマンスを最適化します。
実験結果は、私たちの方法が以前のアプローチを上回り、複数の評価メトリックにわたって最先端のパフォーマンスを達成することを示しています。

要約(オリジナル)

Radiology Report Generation (RRG) is an important research topic for relieving radiologist’ heavy workload. Existing RRG models mainly rely on supervised fine-tuning (SFT) based on different model architectures using data pairs of radiological images and corresponding radiologist-annotated reports. Recent research has shifted focus to post-training improvements, aligning RRG model outputs with human preferences using reinforcement learning (RL). However, the limited data coverage of high-quality annotated data poses risks of overfitting and generalization. This paper proposes a novel Online Iterative Self-Alignment (OISA) method for RRG that consists of four stages: self-generation of diverse data, self-evaluation for multi-objective preference data,self-alignment for multi-objective optimization and self-iteration for further improvement. Our approach allows for generating varied reports tailored to specific clinical objectives, enhancing the overall performance of the RRG model iteratively. Unlike existing methods, our frame-work significantly increases data quality and optimizes performance through iterative multi-objective optimization. Experimental results demonstrate that our method surpasses previous approaches, achieving state-of-the-art performance across multiple evaluation metrics.

arxiv情報

著者 Ting Xiao,Lei Shi,Yang Zhang,HaoFeng Yang,Zhe Wang,Chenjia Bai
発行日 2025-05-20 14:49:41+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CV パーマリンク