Probabilistic Learning of Multivariate Time Series with Temporal Irregularity

要約

実際に収集された多変量の連続データには、不均一な時間間隔やコンポーネントの位置ずれなどの時間的な不規則性が見られることがよくあります。
ただし、不均一な間隔と非同期性が不十分な観察の結果ではなく、データの内生的特性である場合、これらの不規則性の情報内容は、多変量依存構造の特徴付けにおいて決定的な役割を果たします。
確率的予測の既存のアプローチは、結果として生じる統計的不均一性を見逃したり、代入バイアスの影響を受けやすかったり、データ分布にパラメトリックな仮定を課したりするかのいずれかです。
この論文では、時間的不規則性の核心となるモデル構築の中心的な役割を観測到着時間に果たさせることで、これらの制限を克服するエンドツーエンドのソリューションを提案します。
一時的な不規則性を認識するために、まずコンポーネントの一意の隠れ状態を有効にして、到着時刻によっていつ、どのように、どの隠れ状態を更新するかを決定できるようにします。
次に、通常は非ガウス分布であるデータ分布をノンパラメトリックに表現する条件付きフロー表現を開発し、対数尤度目標を慎重に因数分解してこの表現を監視し、時間変動と経路依存性の捕捉を容易にする条件付き情報を選択します。
提案されたソリューションの広範な適用性と優位性は、アブレーション研究や実世界のデータセットでのテストを通じて既存のアプローチと比較することで確認されます。

要約(オリジナル)

Multivariate sequential data collected in practice often exhibit temporal irregularities, including nonuniform time intervals and component misalignment. However, if uneven spacing and asynchrony are endogenous characteristics of the data rather than a result of insufficient observation, the information content of these irregularities plays a defining role in characterizing the multivariate dependence structure. Existing approaches for probabilistic forecasting either overlook the resulting statistical heterogeneities, are susceptible to imputation biases, or impose parametric assumptions on the data distribution. This paper proposes an end-to-end solution that overcomes these limitations by allowing the observation arrival times to play the central role of model construction, which is at the core of temporal irregularities. To acknowledge temporal irregularities, we first enable unique hidden states for components so that the arrival times can dictate when, how, and which hidden states to update. We then develop a conditional flow representation to non-parametrically represent the data distribution, which is typically non-Gaussian, and supervise this representation by carefully factorizing the log-likelihood objective to select conditional information that facilitates capturing time variation and path dependency. The broad applicability and superiority of the proposed solution are confirmed by comparing it with existing approaches through ablation studies and testing on real-world datasets.

arxiv情報

著者 Yijun Li,Cheuk Hang Leung,Qi Wu
発行日 2023-06-15 14:08:48+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.AI, cs.LG パーマリンク