Federated Learning for Early Dropout Prediction on Healthy Ageing Applications

要約

ソーシャル ケア アプリケーションの提供は、高齢者にとって生活の質を向上させるために不可欠であり、オペレーターが早期に介入できるようになります。
健全な老化が進むアプリケーションでは、ユーザーのドロップアウトを正確に予測することが不可欠です。ユーザーのドロップアウトは個人の健康状態に直接関係しているからです。
機械学習 (ML) アルゴリズムにより、非常に正確な予測が可能になり、個々のパターンに対処するのが難しい従来の統計手法を上回りました。
ただし、ML ではトレーニングに大量のデータが必要ですが、個人を特定できる情報 (PII) の存在と規制による断片化により、これは困難です。
このペーパーでは、プライバシーの懸念を最小限に抑え、個別のデータを転送せずに分散トレーニングを可能にするフェデレーテッド機械学習 (FML) アプローチを紹介します。
私たちは、クロスデバイスとクロスサイロの両方の学習シナリオをモデル化する FML に基づいて個人と組織を考慮して、共同トレーニングを採用しています。
私たちのアプローチは、クライアント間で非独立で同一に分散された (非 iid) データ、クラスの不均衡、ラベルの曖昧さを含む現実世界のデータセットで評価されます。
私たちの結果は、データ選択とクラスの不均衡処理技術により、FML でトレーニングされたモデルの予測精度が大幅に向上し、従来の ML モデルと同等またはそれ以上の予測パフォーマンスを示していることを示しています。

要約(オリジナル)

The provision of social care applications is crucial for elderly people to improve their quality of life and enables operators to provide early interventions. Accurate predictions of user dropouts in healthy ageing applications are essential since they are directly related to individual health statuses. Machine Learning (ML) algorithms have enabled highly accurate predictions, outperforming traditional statistical methods that struggle to cope with individual patterns. However, ML requires a substantial amount of data for training, which is challenging due to the presence of personal identifiable information (PII) and the fragmentation posed by regulations. In this paper, we present a federated machine learning (FML) approach that minimizes privacy concerns and enables distributed training, without transferring individual data. We employ collaborative training by considering individuals and organizations under FML, which models both cross-device and cross-silo learning scenarios. Our approach is evaluated on a real-world dataset with non-independent and identically distributed (non-iid) data among clients, class imbalance and label ambiguity. Our results show that data selection and class imbalance handling techniques significantly improve the predictive accuracy of models trained under FML, demonstrating comparable or superior predictive performance than traditional ML models.

arxiv情報

著者 Christos Chrysanthos Nikolaidis,Vasileios Perifanis,Nikolaos Pavlidis,Pavlos S. Efraimidis
発行日 2023-09-08 13:17:06+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.DC, cs.LG パーマリンク