要約
我々は、放射線医学レポートから情報を抽出するための新しいデータセットである RadGraph2 を紹介します。これは、経時的な病状とデバイスの配置の変化を捉えることに焦点を当てています。
関係に基づいてエンティティを編成する階層スキーマを導入し、トレーニング中にこの階層を使用すると情報抽出モデルのパフォーマンスが向上することを示します。
具体的には、DyGIE++ フレームワークへの変更を提案し、その結果、エンティティと関係の抽出タスクにおいて以前のモデルよりも優れたモデル HGIE が得られます。
RadGraph2 を使用すると、元の RadGraph データセットでトレーニングされたモデルと比較して、モデルがより多様な結果を取得し、関係抽出でより優れたパフォーマンスを発揮できることを実証します。
私たちの研究は、病気の進行を長期にわたって追跡し、医療領域におけるラベルの自然な階層を活用した情報抽出モデルを開発できる自動化システムを開発するための基盤を提供します。
要約(オリジナル)
We present RadGraph2, a novel dataset for extracting information from radiology reports that focuses on capturing changes in disease state and device placement over time. We introduce a hierarchical schema that organizes entities based on their relationships and show that using this hierarchy during training improves the performance of an information extraction model. Specifically, we propose a modification to the DyGIE++ framework, resulting in our model HGIE, which outperforms previous models in entity and relation extraction tasks. We demonstrate that RadGraph2 enables models to capture a wider variety of findings and perform better at relation extraction compared to those trained on the original RadGraph dataset. Our work provides the foundation for developing automated systems that can track disease progression over time and develop information extraction models that leverage the natural hierarchy of labels in the medical domain.
arxiv情報
著者 | Sameer Khanna,Adam Dejl,Kibo Yoon,Quoc Hung Truong,Hanh Duong,Agustina Saenz,Pranav Rajpurkar |
発行日 | 2023-08-09 16:19:43+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google