Natural Language Processing for Electronic Health Records in Scandinavian Languages: Norwegian, Swedish, and Danish

要約

背景:臨床自然言語処理(NLP)は、非構造化された臨床テキストデータを抽出、処理、分析するための計算方法の使用を指し、さまざまな臨床タスクで医療を変換する大きな可能性を秘めています。
目的:この研究の目的は、スカンジナビア本土の臨床テキストの最先端のNLPメソッドを包括的に評価および分析するための系統的レビューを実行することです。
方法:PubMed、Sciencedirect、Google Scholar、ACM Digital Library、IEEE Xploreを含むさまざまなオンラインデータベースで文献検索が実施されました。2022年12月から2024年2月までに、追加の記事への関連する言及も使用されました。
最終プールには、スカンジナビアの本土で臨床NLPを実施し、2010年から2024年の間に英語で掲載された記事が含まれています。
一般的に、このレビューでは、言語間のいくつかの観察可能なギャップと格差にもかかわらず、地域全体の肯定的な発展を特定しました。
トランスベースのモデルの採用レベルにはかなりの格差があります。
識別除去などの重要なタスクでは、スウェーデンのテキストと比較してノルウェーとデンマーク語に焦点を当てた研究活動が大幅に少ないです。
さらに、このレビューでは、データ、実験コード、事前に訓練されたモデル、地域の適応および転送学習率など、低レベルの共有リソースが特定されました。
結論:このレビューは、スカンジナビアの本土の電子健康記録(EHR)テキストの最先端の臨床NLPの包括的な評価を提示し、地域の分野の急速な進歩を妨げる潜在的な障壁と課題を強調しました。

要約(オリジナル)

Background: Clinical natural language processing (NLP) refers to the use of computational methods for extracting, processing, and analyzing unstructured clinical text data, and holds a huge potential to transform healthcare in various clinical tasks. Objective: The study aims to perform a systematic review to comprehensively assess and analyze the state-of-the-art NLP methods for the mainland Scandinavian clinical text. Method: A literature search was conducted in various online databases including PubMed, ScienceDirect, Google Scholar, ACM digital library, and IEEE Xplore between December 2022 and February 2024. Further, relevant references to the included articles were also used to solidify our search. The final pool includes articles that conducted clinical NLP in the mainland Scandinavian languages and were published in English between 2010 and 2024. Results: Out of the 113 articles, 18% (n=21) focus on Norwegian clinical text, 64% (n=72) on Swedish, 10% (n=11) on Danish, and 8% (n=9) focus on more than one language. Generally, the review identified positive developments across the region despite some observable gaps and disparities between the languages. There are substantial disparities in the level of adoption of transformer-based models. In essential tasks such as de-identification, there is significantly less research activity focusing on Norwegian and Danish compared to Swedish text. Further, the review identified a low level of sharing resources such as data, experimentation code, pre-trained models, and rate of adaptation and transfer learning in the region. Conclusion: The review presented a comprehensive assessment of the state-of-the-art Clinical NLP for electronic health records (EHR) text in mainland Scandinavian languages and, highlighted the potential barriers and challenges that hinder the rapid advancement of the field in the region.

arxiv情報

著者 Ashenafi Zebene Woldaregay,Jørgen Aarmo Lund,Phuong Dinh Ngo,Mariyam Tayefi,Joel Burman,Stine Hansen,Martin Hylleholt Sillesen,Hercules Dalianis,Robert Jenssen,Lindsetmo Rolf Ole,Karl Øyvind Mikalsen
発行日 2025-03-24 10:47:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク