要約
この論文では、検査方法全体で一般化して、注釈付きデータの要件を軽減する放射線医学レポートから情報を抽出する方法を検討します。
マルチパス T5 ベースのテキスト間生成モデルは、BERT ベースのタスク固有の分類層を使用するアプローチと比較して、試験モダリティ全体で優れた一般化を示すことを実証します。
次に、モデルの推論コストを削減し、臨床応用で大規模なコーパス処理をより実現可能にする方法を開発します。
具体的には、複雑なタスクをより小さなサブタスク ブロックに分解する生成手法を導入します。これにより、マルチタスク トレーニングと組み合わせることでシングルパス モデルが改善されます。
さらに、推論中にターゲット ドメインのコンテキストを活用してドメインの適応を強化し、より小さなモデルの使用を可能にします。
分析により、さまざまなコスト削減戦略の利点についての洞察が得られます。
要約(オリジナル)
This paper explores methods for extracting information from radiology reports that generalize across exam modalities to reduce requirements for annotated data. We demonstrate that multi-pass T5-based text-to-text generative models exhibit better generalization across exam modalities compared to approaches that employ BERT-based task-specific classification layers. We then develop methods that reduce the inference cost of the model, making large-scale corpus processing more feasible for clinical applications. Specifically, we introduce a generative technique that decomposes complex tasks into smaller subtask blocks, which improves a single-pass model when combined with multitask training. In addition, we leverage target-domain contexts during inference to enhance domain adaptation, enabling use of smaller models. Analyses offer insights into the benefits of different cost reduction strategies.
arxiv情報
著者 | Sitong Zhou,Meliha Yetisgen,Mari Ostendorf |
発行日 | 2023-06-15 23:16:58+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google