Advancements in eHealth Data Analytics through Natural Language Processing and Deep Learning

要約

医療環境は一般に「情報が豊富」であると同時に「知識が乏しい」とも言われます。
医療システムは、検査報告書、医療レター、医療ツールやプログラムのログ、処方箋など、さまざまなソースから膨大な量のデータを収集します。これらの大量のデータセットは、医療サービスを向上させることができる優れた知識と情報を提供し、医療サービス全体を向上させることができます。
疾患の行動要因の発見を促進することにより、患者の症状や疾患の予防を分析することによる疾患の予測などのヘルスケア領域。
残念ながら、比較的少量のテキスト形式の eHealth データのみが処理および解釈されます。重要な要因は、ビッグ データ操作を効率的に実行することが難しいことです。
医療分野では、ドメイン固有の複数単語の用語を検出することは、少数の単語で概念全体を定義できるため、重要なタスクです。
用語は言語構造または概念として定義でき、ドメインに対して特定の意味を持つ 1 つ以上の単語で構成されます。
ドメインのすべての用語がその用語を作成します。
この章では、非構造化 (画像およびテキスト) eHealth データを分析するための、現在最もパフォーマンスの高いソリューションに関する重要な研究を提供します。
この研究では、eHealth の文脈における現在の自然言語処理と深層学習技術の比較も提供します。
最後に、現在の問題のいくつかを調査して議論し、この分野における一連の研究の方向性を定義します。

要約(オリジナル)

The healthcare environment is commonly referred to as ‘information-rich’ but also ‘knowledge poor’. Healthcare systems collect huge amounts of data from various sources: lab reports, medical letters, logs of medical tools or programs, medical prescriptions, etc. These massive sets of data can provide great knowledge and information that can improve the medical services, and overall the healthcare domain, such as disease prediction by analyzing the patient’s symptoms or disease prevention, by facilitating the discovery of behavioral factors for diseases. Unfortunately, only a relatively small volume of the textual eHealth data is processed and interpreted, an important factor being the difficulty in efficiently performing Big Data operations. In the medical field, detecting domain-specific multi-word terms is a crucial task as they can define an entire concept with a few words. A term can be defined as a linguistic structure or a concept, and it is composed of one or more words with a specific meaning to a domain. All the terms of a domain create its terminology. This chapter offers a critical study of the current, most performant solutions for analyzing unstructured (image and textual) eHealth data. This study also provides a comparison of the current Natural Language Processing and Deep Learning techniques in the eHealth context. Finally, we examine and discuss some of the current issues, and we define a set of research directions in this area.

arxiv情報

著者 Elena-Simona Apostol,Ciprian-Octavian Truică
発行日 2024-01-19 17:51:11+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク