Natural language processing to automatically extract the presence and severity of esophagitis in notes of patients undergoing radiotherapy

要約

放射線療法 (RT) の毒性は、生存率と生活の質を損なう可能性がありますが、まだ十分に研究されていません。
現実世界の証拠は、毒性の理解を深める可能性を秘めていますが、毒性情報は多くの場合、臨床記録にのみ記載されています。
胸部放射線治療を受けた患者のメモから食道炎の存在と重症度を識別する自然言語処理 (NLP) モデルを開発しました。
3 つの食道炎分類タスクのために、統計的および事前にトレーニングされた BERT ベースのモデルを微調整しました。
.
RTを受けている食道がん患者からの345件のメモについて、伝達可能性がテストされました。
PubmedBERT を微調整すると、最高のパフォーマンスが得られました。
最適なマクロ F1 は、タスク 1、2、および 3 でそれぞれ 0.92、0.82、および 0.74 でした。
微調整中に最も有益なメモ セクションを選択すると、すべてのタスクでマクロ F1 が 2% 以上改善されました。
銀ラベルのデータは、マクロ F1 をすべてのタスクで 3% 以上改善しました。
食道がんのメモの場合、最適なマクロ F1 は、追加の微調整なしで、タスク 1、2、および 3 でそれぞれ 0.73、0.74、および 0.65 でした。
私たちの知る限り、これは臨床ノートから CTCAE ガイドラインに従って食道炎毒性の重症度を自動的に抽出する最初の試みです。
有望なパフォーマンスは、拡張されたドメインでの NLP ベースの自動化された詳細な毒性モニタリングの概念実証を提供します。

要約(オリジナル)

Radiotherapy (RT) toxicities can impair survival and quality-of-life, yet remain under-studied. Real-world evidence holds potential to improve our understanding of toxicities, but toxicity information is often only in clinical notes. We developed natural language processing (NLP) models to identify the presence and severity of esophagitis from notes of patients treated with thoracic RT. We fine-tuned statistical and pre-trained BERT-based models for three esophagitis classification tasks: Task 1) presence of esophagitis, Task 2) severe esophagitis or not, and Task 3) no esophagitis vs. grade 1 vs. grade 2-3. Transferability was tested on 345 notes from patients with esophageal cancer undergoing RT. Fine-tuning PubmedBERT yielded the best performance. The best macro-F1 was 0.92, 0.82, and 0.74 for Task 1, 2, and 3, respectively. Selecting the most informative note sections during fine-tuning improved macro-F1 by over 2% for all tasks. Silver-labeled data improved the macro-F1 by over 3% across all tasks. For the esophageal cancer notes, the best macro-F1 was 0.73, 0.74, and 0.65 for Task 1, 2, and 3, respectively, without additional fine-tuning. To our knowledge, this is the first effort to automatically extract esophagitis toxicity severity according to CTCAE guidelines from clinic notes. The promising performance provides proof-of-concept for NLP-based automated detailed toxicity monitoring in expanded domains.

arxiv情報

著者 Shan Chen,Marco Guevara,Nicolas Ramirez,Arpi Murray,Jeremy L. Warner,Hugo JWL Aerts,Timothy A. Miller,Guergana K. Savova,Raymond H. Mak,Danielle S. Bitterman
発行日 2023-03-24 00:26:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク