Traditional Machine Learning Models and Bidirectional Encoder Representations From Transformer (BERT)-Based Automatic Classification of Tweets About Eating Disorders: Algorithm Development and Validation Study

要約

背景: 摂食障害はますます蔓延しており、ソーシャル ネットワークは貴重な情報を提供します。
目的: 私たちの目標は、摂食障害に関連するツイートを分類するための効率的な機械学習モデルを特定することでした。
方法: 3 か月にわたって、摂食障害に関するツイートを収集しました。
2,000 件のツイートのサブセットには、(1) 摂食障害を持つ個人によって書かれたもの、(2) 摂食障害の促進、(3) 有益性、および (4) 科学的な内容のラベルが付けられました。
従来の機械学習モデルと深層学習モデルの両方が、分類、精度、F1 スコア、計算時間の評価に採用されました。
結果: 収集された 1,058,957 件のツイートから、トランスベースの双方向エンコーダー表現が 4 つのカテゴリすべてで最高の F1 スコア (71.1% ~ 86.4%) を達成しました。
結論: Transformer ベースのモデルは、より多くの計算リソースを必要としますが、摂食障害関連のツイートの分類において従来の手法よりも優れています。

要約(オリジナル)

Background: Eating disorders are increasingly prevalent, and social networks offer valuable information. Objective: Our goal was to identify efficient machine learning models for categorizing tweets related to eating disorders. Methods: Over three months, we collected tweets about eating disorders. A 2,000-tweet subset was labeled for: (1) being written by individuals with eating disorders, (2) promoting eating disorders, (3) informativeness, and (4) scientific content. Both traditional machine learning and deep learning models were employed for classification, assessing accuracy, F1 score, and computational time. Results: From 1,058,957 collected tweets, transformer-based bidirectional encoder representations achieved the highest F1 scores (71.1%-86.4%) across all four categories. Conclusions: Transformer-based models outperform traditional techniques in classifying eating disorder-related tweets, though they require more computational resources.

arxiv情報

著者 José Alberto Benítez-Andrades,José-Manuel Alija-Pérez,Maria-Esther Vidal,Rafael Pastor-Vargas,María Teresa García-Ordás
発行日 2024-02-08 11:16:13+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CL, cs.LG パーマリンク