要約
中国の医療コミュニティ、すなわちMEDCTのために世界初の臨床用語を紹介します。これは、臨床基盤モデルのMedbertとモデルのMedlinkをリンクするエンティティを伴います。
MEDCTシステムは、中国の臨床データの標準化されたプログラム可能な表現を可能にし、人口の多い中国のコミュニティの新しい薬、治療経路、およびより良い患者の転帰の開発を連続的に刺激します。
さらに、MEDCT知識グラフは、大規模な言語モデル(LLM)の幻覚の問題を最小限に抑えるための原則的なメカニズムを提供するため、LLMベースの臨床応用でかなりのレベルの精度と安全性を達成します。
生成性と表現力のLLMSの緊急能力を活用することにより、生産品質の用語システムを迅速に構築し、3か月以内に現実世界の臨床分野に展開することができましたが、Snomed CTのような古典的な用語は20年以上の開発を経験しました。
私たちの実験は、MEDCTシステムが、中国語だけでなく英語のために、セマンティックマッチングとエンティティをリンクするエンティティで最先端の(SOTA)パフォーマンスを達成していることを示しています。
また、電子健康記録(EHR)の自動生成や診断意思決定の医療文書検索など、臨床タスクの代表的なスペクトルにMedCTとLLMを適用することにより、縦方向のフィールド実験を実施しました。
私たちの研究は、特に臨床LLMアプリケーションの新しいジャンルで、臨床ワークフローと患者の転帰のためのMEDCTの多数の値を示しています。
私たちは、他の非英語社会のために臨床用語を実装することを容易に再現できるように、十分なエンジニアリングの詳細でアプローチを提示します。
開発のための実際の臨床データセットとともに、用語、モデル、およびアルゴリズムを公然とリリースします。
要約(オリジナル)
We introduce the world’s first clinical terminology for the Chinese healthcare community, namely MedCT, accompanied by a clinical foundation model MedBERT and an entity linking model MedLink. The MedCT system enables standardized and programmable representation of Chinese clinical data, successively stimulating the development of new medicines, treatment pathways, and better patient outcomes for the populous Chinese community. Moreover, the MedCT knowledge graph provides a principled mechanism to minimize the hallucination problem of large language models (LLMs), therefore achieving significant levels of accuracy and safety in LLM-based clinical applications. By leveraging the LLMs’ emergent capabilities of generativeness and expressiveness, we were able to rapidly built a production-quality terminology system and deployed to real-world clinical field within three months, while classical terminologies like SNOMED CT have gone through more than twenty years development. Our experiments show that the MedCT system achieves state-of-the-art (SOTA) performance in semantic matching and entity linking tasks, not only for Chinese but also for English. We also conducted a longitudinal field experiment by applying MedCT and LLMs in a representative spectrum of clinical tasks, including electronic health record (EHR) auto-generation and medical document search for diagnostic decision making. Our study shows a multitude of values of MedCT for clinical workflows and patient outcomes, especially in the new genre of clinical LLM applications. We present our approach in sufficient engineering detail, such that implementing a clinical terminology for other non-English societies should be readily reproducible. We openly release our terminology, models and algorithms, along with real-world clinical datasets for the development.
arxiv情報
著者 | Ye Chen,Dongdong Huang,Haoyun Xu,Cong Fu,Lin Sheng,Qingli Zhou,Yuqiang Shen,Kai Wang |
発行日 | 2025-04-10 07:29:10+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google