Enhanced Labeling Technique for Reddit Text and Fine-Tuned Longformer Models for Classifying Depression Severity in English and Luganda

要約

うつ病は世界的な重荷であり、コントロールが最も困難なメンタルヘルス状態の 1 つです。
専門家は、Beck Depression Inventory (BDI) アンケートを使用してその重症度を早期に検出し、患者に適切な薬を投与し、その進行を阻止することができます。
多くの患者は、偏見を持たれる可能性を恐れて、人生のさまざまな段階でアドバイスや支援を求めて Reddit などのソーシャル メディア プラットフォームに頼ります。
この調査では、診断プロセスを容易にするために Reddit からテキストを抽出します。
提案されたラベル付けアプローチを採用してテキストを分類し、その後 Longformer モデルを微調整します。
モデルのパフォーマンスは、Naive Bayes、Random Forest、サポート ベクター マシン、Gradient Boosting などのベースライン モデルと比較されます。
私たちの調査結果では、カスタムメイドのデータセットでは、英語 (48%) とルガンダ語 (45%) の両方の言語で、Longformer モデルがベースライン モデルよりも優れたパフォーマンスを示していることが明らかになりました。

要約(オリジナル)

Depression is a global burden and one of the most challenging mental health conditions to control. Experts can detect its severity early using the Beck Depression Inventory (BDI) questionnaire, administer appropriate medication to patients, and impede its progression. Due to the fear of potential stigmatization, many patients turn to social media platforms like Reddit for advice and assistance at various stages of their journey. This research extracts text from Reddit to facilitate the diagnostic process. It employs a proposed labeling approach to categorize the text and subsequently fine-tunes the Longformer model. The model’s performance is compared against baseline models, including Naive Bayes, Random Forest, Support Vector Machines, and Gradient Boosting. Our findings reveal that the Longformer model outperforms the baseline models in both English (48%) and Luganda (45%) languages on a custom-made dataset.

arxiv情報

著者 Richard Kimera,Daniela N. Rim,Joseph Kirabira,Ubong Godwin Udomah,Heeyoul Choi
発行日 2024-01-25 15:28:07+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク