Leveraging Large Language Models through Natural Language Processing to provide interpretable Machine Learning predictions of mental deterioration in real time


公式推計に基づくと、世界中で 5,000 万人が認知症に罹患しており、この数は毎年 1,000 万人ずつ新たな患者として増加しています。
さらに、大規模言語モデル (LLM) は、インテリジェント システムを使用した臨床患者間のコミュニケーションの最も先進的な方法であるにもかかわらず、認知機能低下の診断に使用する例はまだ稀です。
その結果、チャットボット ソリューションで最新の自然言語処理 (NLP) 技術を使用した LLM を活用し、解釈可能な機械学習による認知機能低下の予測をリアルタイムで提供します。
より詳細には、提案されたパイプラインは、(i) NLP ベースのプロンプト エンジニアリングを採用したデータ抽出、および (i) NLP ベースのプロンプト エンジニアリングを採用したデータ抽出で構成されます。
(ii) 特徴量エンジニアリング、分析、選択を含むストリームベースのデータ処理。
(iii) リアルタイム分類。
(iv) 予測結果の視覚的および自然言語による説明を提供する説明可能性ダッシュボード。
分類結果はすべての評価指標で 80 % を超え、精神的劣化クラスの再現率は約 85 % です。


Based on official estimates, 50 million people worldwide are affected by dementia, and this number increases by 10 million new patients every year. Without a cure, clinical prognostication and early intervention represent the most effective ways to delay its progression. To this end, Artificial Intelligence and computational linguistics can be exploited for natural language analysis, personalized assessment, monitoring, and treatment. However, traditional approaches need more semantic knowledge management and explicability capabilities. Moreover, using Large Language Models (LLMs) for cognitive decline diagnosis is still scarce, even though these models represent the most advanced way for clinical-patient communication using intelligent systems. Consequently, we leverage an LLM using the latest Natural Language Processing (NLP) techniques in a chatbot solution to provide interpretable Machine Learning prediction of cognitive decline in real-time. Linguistic-conceptual features are exploited for appropriate natural language analysis. Through explainability, we aim to fight potential biases of the models and improve their potential to help clinical workers in their diagnosis decisions. More in detail, the proposed pipeline is composed of (i) data extraction employing NLP-based prompt engineering; (ii) stream-based data processing including feature engineering, analysis, and selection; (iii) real-time classification; and (iv) the explainability dashboard to provide visual and natural language descriptions of the prediction outcome. Classification results exceed 80 % in all evaluation metrics, with a recall value for the mental deterioration class about 85 %. To sum up, we contribute with an affordable, flexible, non-invasive, personalized diagnostic system to this work.


著者 Francisco de Arriba-Pérez,Silvia García-Méndez
発行日 2024-09-05 09:27:05+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL, cs.LG パーマリンク