tPARAFAC2: Tracking evolving patterns in (incomplete) temporal data

要約

テンソル因数分解は、さまざまなドメインのパターンを明らかにするタスクに広く使用されています。
多くの場合、入力は時間発生的であり、代わりに基礎となるパターンの進化を追跡するための目標をシフトします。
このより複雑な設定に適応するために、既存の方法には一時的な正則化が組み込まれていますが、それらは過度に制約された構造要件を持っているか、解釈に重要な一意性を欠いています。
この論文では、基礎となる進化するパターンをキャプチャするために、進化する要因に一時的な滑らかさの正則化を利用するT(エンパラル)Parafac2を導入します。
以前は、PARAFAC2モデルを完全に観察されたデータに適合させるために、交互の最適化(AO)および交互方向の乗数(ADMM)ベースのアルゴリズムアプローチが導入されています。
このホワイトペーパーでは、このアルゴリズムフレームワークを部分的に観察されたデータの場合に拡張し、それを使用して、進化するパターンを明らかにすることを目的として、TPARAFAC2モデルに適合してデータセットを完成させ、不完全なデータセットを完成させます。
シミュレートされたデータセットでの数値実験は、TPARAFAC2が、高量のノイズと欠落データの存在下で、最先端と比較して、基礎となる進化パターンをより正確に抽出できることを示しています。
2つの実際のデータセットを使用して、進化するパターンを明らかにするという点で、欠損データとTPARAFAC2モデルの処理に関して、アルゴリズムアプローチの有効性も示します。
このペーパーでは、提案されたフレームワーク内で欠落データを処理するためのさまざまなアプローチの広範な比較を提供し、TPARAFAC2モデルの利点と制限の両方について説明します。

要約(オリジナル)

Tensor factorizations have been widely used for the task of uncovering patterns in various domains. Often, the input is time-evolving, shifting the goal to tracking the evolution of the underlying patterns instead. To adapt to this more complex setting, existing methods incorporate temporal regularization but they either have overly constrained structural requirements or lack uniqueness which is crucial for interpretation. In this paper, in order to capture the underlying evolving patterns, we introduce t(emporal)PARAFAC2, which utilizes temporal smoothness regularization on the evolving factors. Previously, Alternating Optimization (AO) and Alternating Direction Method of Multipliers (ADMM)-based algorithmic approach has been introduced to fit the PARAFAC2 model to fully observed data. In this paper, we extend this algorithmic framework to the case of partially observed data and use it to fit the tPARAFAC2 model to complete and incomplete datasets with the goal of revealing evolving patterns. Our numerical experiments on simulated datasets demonstrate that tPARAFAC2 can extract the underlying evolving patterns more accurately compared to the state-of-the-art in the presence of high amounts of noise and missing data. Using two real datasets, we also demonstrate the effectiveness of the algorithmic approach in terms of handling missing data and tPARAFAC2 model in terms of revealing evolving patterns. The paper provides an extensive comparison of different approaches for handling missing data within the proposed framework, and discusses both the advantages and limitations of tPARAFAC2 model.

arxiv情報

著者 Christos Chatzis,Carla Schenker,Max Pfeffer,Evrim Acar
発行日 2025-05-05 16:35:36+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.LG パーマリンク