Linguistic Features Extracted by GPT-4 Improve Alzheimer’s Disease Detection based on Spontaneous Speech

要約

アルツハイマー病 (AD) は、公衆衛生上の重大かつ増大する懸念となっています。
音声および言語パターンの変化を調査することは、費用対効果が高く非侵襲的な大規模なアルツハイマー病の早期検出に向けた有望な道を提供します。
GPT などの大規模言語モデル (LLM) により、セマンティック テキスト分析の強力な新しい可能性が可能になりました。
この研究では、GPT-4 を利用して、患者の自発的な発話のトランスクリプトから 5 つの意味特徴を抽出します。
これらの特徴はアルツハイマー病の既知の症状を捉えていますが、従来の計算言語学の方法を使用して効果的に定量化することは困難です。
我々は、これらの特徴の臨床的重要性を実証し、そのうちの 1 つ (「単語検索の難しさ」) を代理尺度と人間の評価者に対してさらに検証します。
確立された言語特徴およびランダム フォレスト分類器と組み合わせると、GPT 由来の特徴により AD の検出が大幅に向上します。
私たちのアプローチは、手動で書き起こされたトランスクリプトと自動生成されたトランスクリプトの両方に効果的であることが証明されており、AD 音声分析のための LLM の最近の進歩の斬新で影響力のある使用法を表しています。

要約(オリジナル)

Alzheimer’s Disease (AD) is a significant and growing public health concern. Investigating alterations in speech and language patterns offers a promising path towards cost-effective and non-invasive early detection of AD on a large scale. Large language models (LLMs), such as GPT, have enabled powerful new possibilities for semantic text analysis. In this study, we leverage GPT-4 to extract five semantic features from transcripts of spontaneous patient speech. The features capture known symptoms of AD, but they are difficult to quantify effectively using traditional methods of computational linguistics. We demonstrate the clinical significance of these features and further validate one of them (‘Word-Finding Difficulties’) against a proxy measure and human raters. When combined with established linguistic features and a Random Forest classifier, the GPT-derived features significantly improve the detection of AD. Our approach proves effective for both manually transcribed and automatically generated transcripts, representing a novel and impactful use of recent advancements in LLMs for AD speech analysis.

arxiv情報

著者 Jonathan Heitz,Gerold Schneider,Nicolas Langer
発行日 2024-12-20 10:43:42+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.CL パーマリンク