Clustering of timed sequences — Application to the analysis of care pathways

要約

医療の未来を改善するには、病院現場での現在の実際の実践をより深く理解することから始まります。
これにより、患者データから典型的なケア経路を発見するという目的が動機付けられます。
一般的なケア経路を明らかにすることは、クラスタリングによって実現できます。
タイムスタンプ付きイベントのシーケンスによって表されるケア経路をクラスタリングする際の難しさは、意味的に適切なメトリクスとクラスタリング アルゴリズムを定義することにあります。
この記事では、時系列のために開発された 2 つの方法、つまりドロップ DTW メトリクスと、平均化された時間シーケンスの構築のための DBA アプローチを時系列シーケンスのクラスタリングに適用します。
これらの方法は、クラスタリング アルゴリズムに適用され、時限シーケンス用のオリジナルで健全なクラスタリング アルゴリズムが提案されます。
このアプローチは、合成データと現実世界のデータを使用して実験され、評価されます。

要約(オリジナル)

Improving the future of healthcare starts by better understanding the current actual practices in hospital settings. This motivates the objective of discovering typical care pathways from patient data. Revealing typical care pathways can be achieved through clustering. The difficulty in clustering care pathways, represented by sequences of timestamped events, lies in defining a semantically appropriate metric and clustering algorithms. In this article, we adapt two methods developed for time series to the clustering of timed sequences: the drop-DTW metric and the DBA approach for the construction of averaged time sequences. These methods are then applied in clustering algorithms to propose original and sound clustering algorithms for timed sequences. This approach is experimented with and evaluated on synthetic and real-world data.

arxiv情報

著者 Thomas Guyet,Pierre Pinson,Enoal Gesny
発行日 2024-12-19 15:54:17+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク