Leveraging Large Language Models through Natural Language Processing to provide interpretable Machine Learning predictions of mental deterioration in real time

要約

公式推計に基づくと、世界中で 5,000 万人が認知症に罹患しており、この数は毎年 1,000 万人ずつ新たな患者として増加しています。
治療法がない場合、臨床予後と早期介入が進行を遅らせる最も効果的な方法となります。
この目的を達成するために、人工知能と計算言語学を自然言語分析、個別の評価、監視、治療に活用できます。
ただし、従来のアプローチには、よりセマンティックな知識管理と説明能力が必要です。
さらに、大規模言語モデル (LLM) は、インテリジェント システムを使用した臨床患者間のコミュニケーションの最も先進的な方法であるにもかかわらず、認知機能低下の診断に使用する例はまだ稀です。
その結果、チャットボット ソリューションで最新の自然言語処理 (NLP) 技術を使用した LLM を活用し、解釈可能な機械学習による認知機能低下の予測をリアルタイムで提供します。
言語概念の特徴は、適切な自然言語分析に利用されます。
説明可能性を通じて、モデルの潜在的なバイアスと闘い、臨床従事者の診断決定を支援するモデルの可能性を向上させることを目指しています。
より詳細には、提案されたパイプラインは、(i) NLP ベースのプロンプト エンジニアリングを採用したデータ抽出、および (i) NLP ベースのプロンプト エンジニアリングを採用したデータ抽出で構成されます。
(ii) 特徴量エンジニアリング、分析、選択を含むストリームベースのデータ処理。
(iii) リアルタイム分類。
(iv) 予測結果の視覚的および自然言語による説明を提供する説明可能性ダッシュボード。
分類結果はすべての評価指標で 80 % を超え、精神的劣化クラスの再現率は約 85 % です。
要約すると、私たちは手頃な価格で柔軟性があり、非侵襲的で個別化された診断システムでこの取り組みに貢献しています。

要約(オリジナル)

Based on official estimates, 50 million people worldwide are affected by dementia, and this number increases by 10 million new patients every year. Without a cure, clinical prognostication and early intervention represent the most effective ways to delay its progression. To this end, Artificial Intelligence and computational linguistics can be exploited for natural language analysis, personalized assessment, monitoring, and treatment. However, traditional approaches need more semantic knowledge management and explicability capabilities. Moreover, using Large Language Models (LLMs) for cognitive decline diagnosis is still scarce, even though these models represent the most advanced way for clinical-patient communication using intelligent systems. Consequently, we leverage an LLM using the latest Natural Language Processing (NLP) techniques in a chatbot solution to provide interpretable Machine Learning prediction of cognitive decline in real-time. Linguistic-conceptual features are exploited for appropriate natural language analysis. Through explainability, we aim to fight potential biases of the models and improve their potential to help clinical workers in their diagnosis decisions. More in detail, the proposed pipeline is composed of (i) data extraction employing NLP-based prompt engineering; (ii) stream-based data processing including feature engineering, analysis, and selection; (iii) real-time classification; and (iv) the explainability dashboard to provide visual and natural language descriptions of the prediction outcome. Classification results exceed 80 % in all evaluation metrics, with a recall value for the mental deterioration class about 85 %. To sum up, we contribute with an affordable, flexible, non-invasive, personalized diagnostic system to this work.

arxiv情報

著者 Francisco de Arriba-Pérez,Silvia García-Méndez
発行日 2024-09-05 09:27:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク