Deep Temporal Modelling of Clinical Depression through Social Media Text

要約

ユーザーの一時的なソーシャル メディアの投稿に基づいて、ユーザー レベルの臨床的うつ病を検出するモデルの開発について説明します。
私たちのモデルは、うつ病症状検出 (DSD) 分類子を使用します。これは、臨床的うつ病症状について臨床医が注釈を付けたツイートの既存の最大のサンプルでトレーニングされています。
その後、DSDモデルを使用して、臨床的に関連する特徴、たとえばうつ病スコアとその結果として生じる時間的パターン、およびユーザーの投稿活動パターン、たとえば「活動なし」または「無音」の定量化などを抽出します。
これらの抽出された機能の有効性を評価するために、ユーザーレベルのうつ病検出のための 2 つの既存のよく知られたベンチマーク データセットから、テスト データセットを含む 3 種類のデータセットを作成します。
次に、いくつかの異なるレベルの時間粒度で、単一の機能、ベースライン機能、および機能除去テストに基づいて精度測定を提供します。
関連するデータ分布と臨床的うつ病検出関連の設定を利用して、作成したデータセット全体のさまざまな機能の影響を完全に把握できます。
最後に、一般に、セマンティック指向の表現モデルのみがうまく機能することを示します。
ただし、トレーニングとテストの分布が似ていて、ユーザーのタイムラインにより多くのデータがある場合は、臨床機能によって全体的なパフォーマンスが向上する可能性があります。
その結果、より感度の高い臨床的うつ病検出設定で使用すると、うつ病スコアの予測能力が大幅に向上します。

要約(オリジナル)

We describe the development of a model to detect user-level clinical depression based on a user’s temporal social media posts. Our model uses a Depression Symptoms Detection (DSD) classifier, which is trained on the largest existing samples of clinician annotated tweets for clinical depression symptoms. We subsequently use our DSD model to extract clinically relevant features, e.g., depression scores and their consequent temporal patterns, as well as user posting activity patterns, e.g., quantifying their “no activity” or “silence.” Furthermore, to evaluate the efficacy of these extracted features, we create three kinds of datasets including a test dataset, from two existing well-known benchmark datasets for user-level depression detection. We then provide accuracy measures based on single features, baseline features and feature ablation tests, at several different levels of temporal granularity. The relevant data distributions and clinical depression detection related settings can be exploited to draw a complete picture of the impact of different features across our created datasets. Finally, we show that, in general, only semantic oriented representation models perform well. However, clinical features may enhance overall performance provided that the training and testing distribution is similar, and there is more data in a user’s timeline. The consequence is that the predictive capability of depression scores increase significantly while used in a more sensitive clinical depression detection settings.

arxiv情報

著者 Nawshad Farruque,Randy Goebel,Sudhakar Sivapalan,Osmar R. Zaïane
発行日 2023-03-30 15:03:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク