PHEONA: An Evaluation Framework for Large Language Model-based Approaches to Computational Phenotyping

要約

計算表現型は生物医学の研究に不可欠ですが、特に従来の方法には一般的に広範な手動データレビューが含まれるため、多くの場合、かなりの時間とリソースが必要です。
機械学習と自然言語処理の進歩が役立っていますが、さらなる改善が必要です。
テキストベースのタスクのLLMの既知の利点にもかかわらず、これらのタスクに大きな言語モデル(LLMS)を使用して調査した研究はほとんどありません。
この分野でのさらなる研究を容易にするために、コンテキスト固有の考慮事項を概説する観察健康データ(Pheona)の表現型の評価、評価フレームワークを開発しました。
概念分類にPheonaを適用し、実証しました。これは、急性呼吸不全(ARF)呼吸補助療法のためのより広範な表現型療法プロセス内の特定のタスクです。
テストしたサンプルの概念から、高い分類精度を達成し、LLMベースの方法が計算表現型プロセスを改善する可能性を示唆しています。

要約(オリジナル)

Computational phenotyping is essential for biomedical research but often requires significant time and resources, especially since traditional methods typically involve extensive manual data review. While machine learning and natural language processing advancements have helped, further improvements are needed. Few studies have explored using Large Language Models (LLMs) for these tasks despite known advantages of LLMs for text-based tasks. To facilitate further research in this area, we developed an evaluation framework, Evaluation of PHEnotyping for Observational Health Data (PHEONA), that outlines context-specific considerations. We applied and demonstrated PHEONA on concept classification, a specific task within a broader phenotyping process for Acute Respiratory Failure (ARF) respiratory support therapies. From the sample concepts tested, we achieved high classification accuracy, suggesting the potential for LLM-based methods to improve computational phenotyping processes.

arxiv情報

著者 Sarah Pungitore,Shashank Yadav,Vignesh Subbian
発行日 2025-04-07 17:43:00+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL パーマリンク