Clustering Three-Way Data with Outliers

要約

行列変量分布は、モデルベースのクラスタリング分野に最近追加されたもので、これにより、画像や時系列などの複雑な構造を持つ行列形式のデータを分析できるようになります。
最近登場したため、行列変量データに関する文献は限られており、これらのモデルの外れ値の処理に関する文献はさらに少なくなっています。
外れ値を含む行列変量正規データをクラスタリングするアプローチについて説明します。
このアプローチでは、サブセット対数尤度の分布を使用し、OCLUST アルゴリズムを行列変量正規データに拡張し、反復アプローチを使用して外れ値を検出してトリミングします。

要約(オリジナル)

Matrix-variate distributions are a recent addition to the model-based clustering field, thereby making it possible to analyze data in matrix form with complex structure such as images and time series. Due to its recent appearance, there is limited literature on matrix-variate data, with even less on dealing with outliers in these models. An approach for clustering matrix-variate normal data with outliers is discussed. The approach, which uses the distribution of subset log-likelihoods, extends the OCLUST algorithm to matrix-variate normal data and uses an iterative approach to detect and trim outliers.

arxiv情報

著者 Katharine M. Clark,Paul D. McNicholas
発行日 2024-10-01 16:08:52+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG, stat.ML パーマリンク