要約
臨床試験のマッチングは、医療提供と発見における重要なプロセスである。実際には、膨大な非構造化データとスケーラブルでない手動処理に悩まされている。本論文では、大規模言語モデル(LLM)を使用した臨床試験マッチングのスケーリングについて、腫瘍学を中心に体系的な研究を行う。我々の研究は、現在米国の大規模医療ネットワークで試験的に導入されている臨床試験マッチングシステムを基盤としている。GPT-4のような最先端のLLMは、すぐにでも臨床試験の精巧な適格基準を構造化し、複雑なマッチングロジック(入れ子のAND/OR/NOTなど)を抽出することができる。まだ完璧には程遠いものの、LLMは先行する強力なベースラインを大幅に凌駕しており、人間がループに参加することで、患者と治験候補者のトリアージに役立つ予備的なソリューションとして役立つ可能性がある。我々の研究はまた、LLMをエンドツーエンドの臨床試験マッチングに適用するためのいくつかの重要な成長領域を明らかにした。例えば、コンテキストの制限や精度、特に縦断的な医療記録から患者情報を構造化する場合などである。
要約(オリジナル)
Clinical trial matching is a key process in health delivery and discovery. In practice, it is plagued by overwhelming unstructured data and unscalable manual processing. In this paper, we conduct a systematic study on scaling clinical trial matching using large language models (LLMs), with oncology as the focus area. Our study is grounded in a clinical trial matching system currently in test deployment at a large U.S. health network. Initial findings are promising: out of box, cutting-edge LLMs, such as GPT-4, can already structure elaborate eligibility criteria of clinical trials and extract complex matching logic (e.g., nested AND/OR/NOT). While still far from perfect, LLMs substantially outperform prior strong baselines and may serve as a preliminary solution to help triage patient-trial candidates with humans in the loop. Our study also reveals a few significant growth areas for applying LLMs to end-to-end clinical trial matching, such as context limitation and accuracy, especially in structuring patient information from longitudinal medical records.
arxiv情報
著者 | Cliff Wong,Sheng Zheng,Yu Gu,Christine Moung,Jacob Abel,Naoto Usuyama,Roshanthi Weerasinghe,Brian Piening,Tristan Naumann,Carlo Bifulco,Hoifung Poon |
発行日 | 2023-08-04 07:51:15+00:00 |
arxivサイト | arxiv_id(pdf) |