Multivariate Functional Linear Discriminant Analysis for the Classification of Short Time Series with Missing Data

要約

関数線形判別分析 (FLDA) は、LDA を介した多クラス分類と次元削減を単変量時系列関数に拡張する強力なツールです。
ただし、大規模な多変量データや不完全なデータの時代では、欠損データにも対処しながら、特徴間の統計的な依存関係を計算的に扱いやすい方法で推定する必要があります。
特徴間の統計的な依存関係を考慮し、欠損値を処理できる、計算的に扱いやすいアプローチが必要です。
ここでは、この問題に取り組むために FLDA の多変量バージョン (MUDRA) を開発し、そのパラメーターを推論するための効率的な期待値/条件付き最大化 (ECM) アルゴリズムについて説明します。
私たちは、「Articulary Word Recognition」データセットに対するその予測力を評価し、特に欠損データの場合に、最先端のものよりも改善されていることを示します。
MUDRA を使用すると、欠損データの大部分を含むデータ セットを解釈可能に分類できるため、医療または心理学のデータ セットに特に役立ちます。

要約(オリジナル)

Functional linear discriminant analysis (FLDA) is a powerful tool that extends LDA-mediated multiclass classification and dimension reduction to univariate time-series functions. However, in the age of large multivariate and incomplete data, statistical dependencies between features must be estimated in a computationally tractable way, while also dealing with missing data. There is a need for a computationally tractable approach that considers the statistical dependencies between features and can handle missing values. We here develop a multivariate version of FLDA (MUDRA) to tackle this issue and describe an efficient expectation/conditional-maximization (ECM) algorithm to infer its parameters. We assess its predictive power on the ‘Articulary Word Recognition’ data set and show its improvement over the state-of-the-art, especially in the case of missing data. MUDRA allows interpretable classification of data sets with large proportions of missing data, which will be particularly useful for medical or psychological data sets.

arxiv情報

著者 Rahul Bordoloi,Clémence Réda,Orell Trautmann,Saptarshi Bej,Olaf Wolkenhauer
発行日 2024-02-20 15:58:45+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62R07, 62R10, cs.LG, math.ST, stat.TH パーマリンク