4TaStiC: Time and trend traveling time series clustering for classifying long-term type 2 diabetes patients

要約

糖尿病は、世界で最も一般的な疾患の1つであり、さまざまな内臓やシステムを損傷することができる持続的に高血糖レベルを特徴としています。
糖尿病患者は日常的な検査を必要とし、その結果、ヘモグロビンA1Cなどの一連の実験室記録が生じ、各患者の健康行動を経時的に反映し、医師の推奨事項を通知します。
時系列全体に基づいて患者をグループにクラスタリングすると、すべての記録を確認する必要なく、医師が推奨を行い、治療を選択するのに役立ちます。
ただし、このタイプのデータセットの時系列クラスタリングにより、いくつかの課題が導入されます。
患者はさまざまな時点で医師を訪問し、トレンド、ピーク、パターンをキャプチャして一致させることを困難にします。
さらに、2つの側面を考慮する必要があります。実験室の結果のレベルの違いと、傾向とパターンの違い。
これらの課題に対処するために、ユークリッドおよびピアソン相関メトリックと組み合わせたベースの非類似度測定を使用して、時間とトレンドの移動時系列クラスタリング(4tastic)と呼ばれる新しいクラスタリングアルゴリズムを導入します。
このアルゴリズムを人工データセットで評価し、そのパフォーマンスを7つの既存の方法のパフォーマンスと比較しました。
結果は、4tasticがターゲットデータセットの他のメソッドを上回ったことを示しています。
最後に、Siriraj病院で1,989型糖尿病患者のコホートをクラスター化するために4Tasticを適用しました。
患者の各グループは、効率的な臨床決定を行う際に医師に利益をもたらす明確な特性を示します。
さらに、提案されたアルゴリズムは、医療分野の外側のコンテキストに適用できます。

要約(オリジナル)

Diabetes is one of the most prevalent diseases worldwide, characterized by persistently high blood sugar levels, capable of damaging various internal organs and systems. Diabetes patients require routine check-ups, resulting in a time series of laboratory records, such as hemoglobin A1c, which reflects each patient’s health behavior over time and informs their doctor’s recommendations. Clustering patients into groups based on their entire time series data assists doctors in making recommendations and choosing treatments without the need to review all records. However, time series clustering of this type of dataset introduces some challenges; patients visit their doctors at different time points, making it difficult to capture and match trends, peaks, and patterns. Additionally, two aspects must be considered: differences in the levels of laboratory results and differences in trends and patterns. To address these challenges, we introduce a new clustering algorithm called Time and Trend Traveling Time Series Clustering (4TaStiC), using a base dissimilarity measure combined with Euclidean and Pearson correlation metrics. We evaluated this algorithm on artificial datasets, comparing its performance with that of seven existing methods. The results show that 4TaStiC outperformed the other methods on the targeted datasets. Finally, we applied 4TaStiC to cluster a cohort of 1,989 type 2 diabetes patients at Siriraj Hospital. Each group of patients exhibits clear characteristics that will benefit doctors in making efficient clinical decisions. Furthermore, the proposed algorithm can be applied to contexts outside the medical field.

arxiv情報

著者 Onthada Preedasawakul,Nathakhun Wiroonsri
発行日 2025-05-12 16:10:32+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: (Primary), 92C50, cs.CY, cs.LG パーマリンク