要約
臨床試験のマッチングは、健康の提供と発見における重要なプロセスです。
実際には、膨大な非構造化データと拡張不可能な手動処理に悩まされています。
この論文では、腫瘍学を焦点領域として、大規模言語モデル (LLM) を使用した臨床試験マッチングのスケーリングに関する体系的な研究を実施します。
私たちの研究は、現在米国の大規模な医療ネットワークで試験導入中の臨床試験マッチング システムに基づいています。
初期の発見は有望です。GPT-4 などの最先端の LLM は、すぐに使用できる状態で、すでに臨床試験の精緻な適格性基準を構築し、複雑なマッチング ロジック (例: ネストされた AND/OR/NOT) を抽出できます。
まだ完璧には程遠いものの、LLM は以前の強力なベースラインを大幅に上回っており、人間が参加して患者の治験候補者をトリアージするのに役立つ予備的なソリューションとして機能する可能性があります。
私たちの研究では、特に長期的な医療記録からの患者情報の構造化において、コンテキストの制限や精度など、エンドツーエンドの臨床試験マッチングに LLM を適用するための重要な成長領域がいくつか明らかになりました。
要約(オリジナル)
Clinical trial matching is a key process in health delivery and discovery. In practice, it is plagued by overwhelming unstructured data and unscalable manual processing. In this paper, we conduct a systematic study on scaling clinical trial matching using large language models (LLMs), with oncology as the focus area. Our study is grounded in a clinical trial matching system currently in test deployment at a large U.S. health network. Initial findings are promising: out of box, cutting-edge LLMs, such as GPT-4, can already structure elaborate eligibility criteria of clinical trials and extract complex matching logic (e.g., nested AND/OR/NOT). While still far from perfect, LLMs substantially outperform prior strong baselines and may serve as a preliminary solution to help triage patient-trial candidates with humans in the loop. Our study also reveals a few significant growth areas for applying LLMs to end-to-end clinical trial matching, such as context limitation and accuracy, especially in structuring patient information from longitudinal medical records.
arxiv情報
| 著者 | Cliff Wong,Sheng Zhang,Yu Gu,Christine Moung,Jacob Abel,Naoto Usuyama,Roshanthi Weerasinghe,Brian Piening,Tristan Naumann,Carlo Bifulco,Hoifung Poon |
| 発行日 | 2023-08-07 02:53:06+00:00 |
| arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google