LeafAI: query generator for clinical cohort discovery rivaling a human programmer


– クエリにより研究における患者特定は非常に重要
– LeafAIは、複雑な臨床試験適合性基準に対する革新的な論理推論機能を提供しながら、データモデルに依存しないクエリを生成するシステムを作成する目的で開発されました。
– LeafAIには、UMLSの知識ベースとリンクしたオントロジーに加えて、ハイブリッド深層学習およびルールベースのモジュールが組み込まれています。これらにより、名前付きエンティティの認識や関係抽出、シーケンス間の変換、正規化、推論などのテキスト処理問題を解決できます。
– LeafAIは、データモデルに依存しないクエリを生成するための、UMLSコンセプトを使用した新しい方法を導入しています。
– LeafAIの性能を評価するために、同機関で実施された8つの臨床試験に登録された患者を特定する能力を比較しました。その結果、LeafAIが人工データベースプログラマーと比較して多くの登録患者を一致させることが可能であることが示されました。人工データベースプログラマーは26時間を費やし、LeafAIは数分でクエリ生成が可能でした。
– LeafAIは、UMLSを知識ベースとして使用し、統一的なクエリ生成システムを提供することで、臨床コホート発見に革新的な貢献を行っています。


Objective: Identifying study-eligible patients within clinical databases is a critical step in clinical research. However, accurate query design typically requires extensive technical and biomedical expertise. We sought to create a system capable of generating data model-agnostic queries while also providing novel logical reasoning capabilities for complex clinical trial eligibility criteria. Materials and Methods: The task of query creation from eligibility criteria requires solving several text-processing problems, including named entity recognition and relation extraction, sequence-to-sequence transformation, normalization, and reasoning. We incorporated hybrid deep learning and rule-based modules for these, as well as a knowledge base of the Unified Medical Language System (UMLS) and linked ontologies. To enable data-model agnostic query creation, we introduce a novel method for tagging database schema elements using UMLS concepts. To evaluate our system, called LeafAI, we compared the capability of LeafAI to a human database programmer to identify patients who had been enrolled in 8 clinical trials conducted at our institution. We measured performance by the number of actual enrolled patients matched by generated queries. Results: LeafAI matched a mean 43% of enrolled patients with 27,225 eligible across 8 clinical trials, compared to 27% matched and 14,587 eligible in queries by a human database programmer. The human programmer spent 26 total hours crafting queries compared to several minutes by LeafAI. Conclusions: Our work contributes a state-of-the-art data model-agnostic query generation system capable of conditional reasoning using a knowledge base. We demonstrate that LeafAI can rival a human programmer in finding patients eligible for clinical trials.


著者 Nicholas J Dobbins,Bin Han,Weipeng Zhou,Kristine Lan,H. Nina Kim,Robert Harrington,Ozlem Uzuner,Meliha Yetisgen
発行日 2023-04-13 00:34:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, OpenAI

カテゴリー: cs.CL パーマリンク