Forest Proximities for Time Series

要約

RF-GAP は、改良されたランダム フォレスト近接測定として最近導入されました。
この論文では、RF-GAP の近接性を近接林に拡張した、正確かつ効率的な時系列分類モデルである PF-GAP を紹介します。
多次元尺度法と組み合わせて森林近接度を使用して、単変量時系列のベクトル埋め込みを取得し、その埋め込みをさまざまな時系列距離測定を使用して取得したベクトル埋め込みと比較します。
また、局所外れ値因子と併せて森林の近接性を使用して、時系列距離測定を使用する最近傍分類器と比較して、誤分類された点と外れ値の間の関係を調査します。
森林の近接性は、最近傍分類器よりも誤って分類された点と外れ値との間に強いつながりを示す可能性があることを示します。

要約(オリジナル)

RF-GAP has recently been introduced as an improved random forest proximity measure. In this paper, we present PF-GAP, an extension of RF-GAP proximities to proximity forests, an accurate and efficient time series classification model. We use the forest proximities in connection with Multi-Dimensional Scaling to obtain vector embeddings of univariate time series, comparing the embeddings to those obtained using various time series distance measures. We also use the forest proximities alongside Local Outlier Factors to investigate the connection between misclassified points and outliers, comparing with nearest neighbor classifiers which use time series distance measures. We show that the forest proximities may exhibit a stronger connection between misclassified points and outliers than nearest neighbor classifiers.

arxiv情報

著者 Ben Shaw,Jake Rhodes,Soukaina Filali Boubrahimi,Kevin R. Moon
発行日 2024-10-07 16:41:49+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク