要約
目的: このレビューは、電子医療記録 (EHR) と臨床メモを使用したがん研究における自然言語処理 (NLP) 技術の応用を分析することを目的としています。
このレビューは、特定のがんの種類や用途に焦点を当てた以前の研究よりも広い視点を提供することで、既存の文献のギャップに対処しています。
方法: Scopus データベースを使用して包括的な文献検索を実施し、2019 年から 2024 年の間に発表された 94 件の関連研究を特定しました。データ抽出には、研究の特徴、がんの種類、NLP 方法論、データセット情報、パフォーマンス指標、課題、将来の方向性が含まれます。
研究はがんの種類と NLP の応用に基づいて分類されました。
結果: その結果、がん研究への NLP 適用が増加傾向にあり、乳がん、肺がん、および結腸直腸がんが最も研究されていることがわかりました。
情報抽出とテキスト分類が主要な NLP タスクとして浮上しました。
ルールベースから高度な機械学習技術、特にトランスフォーマーベースのモデルへの移行が観察されました。
既存の研究で使用されているデータセットのサイズは多岐にわたります。
主な課題には、提案されたソリューションの一般化可能性が限られていることと、臨床ワークフローへの統合を改善する必要性が含まれます。
結論: NLP 技術は、がん研究における EHR および臨床記録の分析において大きな可能性を示しています。
ただし、今後の研究は、モデルの一般化性の向上、複雑な臨床言語の処理における堅牢性の強化、および研究が十分に進んでいない種類のがんへの適用の拡大に焦点を当てる必要があります。
NLP ツールを臨床実践に統合し、倫理的配慮に取り組むことは、がんの診断、治療、患者の転帰を向上させる上で NLP の可能性を最大限に活用するために引き続き重要です。
要約(オリジナル)
Objective: This review aims to analyze the application of natural language processing (NLP) techniques in cancer research using electronic health records (EHRs) and clinical notes. This review addresses gaps in the existing literature by providing a broader perspective than previous studies focused on specific cancer types or applications. Methods: A comprehensive literature search was conducted using the Scopus database, identifying 94 relevant studies published between 2019 and 2024. Data extraction included study characteristics, cancer types, NLP methodologies, dataset information, performance metrics, challenges, and future directions. Studies were categorized based on cancer types and NLP applications. Results: The results showed a growing trend in NLP applications for cancer research, with breast, lung, and colorectal cancers being the most studied. Information extraction and text classification emerged as predominant NLP tasks. A shift from rule-based to advanced machine learning techniques, particularly transformer-based models, was observed. The Dataset sizes used in existing studies varied widely. Key challenges included the limited generalizability of proposed solutions and the need for improved integration into clinical workflows. Conclusion: NLP techniques show significant potential in analyzing EHRs and clinical notes for cancer research. However, future work should focus on improving model generalizability, enhancing robustness in handling complex clinical language, and expanding applications to understudied cancer types. Integration of NLP tools into clinical practice and addressing ethical considerations remain crucial for utilizing the full potential of NLP in enhancing cancer diagnosis, treatment, and patient outcomes.
arxiv情報
著者 | Muhammad Bilal,Ameer Hamza,Nadia Malik |
発行日 | 2024-10-29 16:17:07+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google