Markovian Gaussian Process Variational Autoencoders

要約

深層生成モデルは、ビデオアニメーション、オーディオ、気候データなどの高次元時系列のモデリングに広く使用されています。
シーケンシャル変分オートエンコーダーは、多くのアプリケーションでうまく検討されており、多くのバリアントモデルは離散時間法とリカレントニューラルネットワーク(RNN)に依存しています。
一方、連続時間法は、特に離散時間法よりもデータをより適切に処理できる不規則にサンプリングされた時系列のコンテキストで、最近注目を集めています。
そのようなクラスの1つに、ガウス過程変分オートエンコーダー(GPVAE)があります。この場合、VAE事前分布はガウス過程(GP)として設定され、カーネル関数と潜在空間の解釈可能性を介して誘導バイアスを明示的にエンコードできます。
ただし、GPVAEの主な制限は、GPと同じ3次計算コストを継承することです。
この作業では、マルコフGPの同等の離散状態空間表現を活用して、カルマンフィルター処理と平滑化を介した線形時間GPソルバーを有効にします。
破損したフレームと欠落したフレームのタスクを介して、特に後者がRNNベースのモデルよりも優れている場合に、このメソッドが良好に実行されることを示します。

要約(オリジナル)

Deep generative models are widely used for modelling high-dimensional time series, such as video animations, audio and climate data. Sequential variational autoencoders have been successfully considered for many applications, with many variant models relying on discrete-time methods and recurrent neural networks (RNNs). On the other hand, continuous-time methods have recently gained attraction, especially in the context of irregularly-sampled time series, where they can better handle the data than discrete-time methods. One such class are Gaussian process variational autoencoders (GPVAEs), where the VAE prior is set as a Gaussian process (GPs), allowing inductive biases to be explicitly encoded via the kernel function and interpretability of the latent space. However, a major limitation of GPVAEs is that it inherits the same cubic computational cost as GPs. In this work, we leverage the equivalent discrete state space representation of Markovian GPs to enable a linear-time GP solver via Kalman filtering and smoothing. We show via corrupt and missing frames tasks that our method performs favourably, especially on the latter where it outperforms RNN-based models.

arxiv情報

著者 Harrison Zhu,Carles Balsells Rodas,Yingzhen Li
発行日 2022-07-12 14:10:01+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: cs.CV, cs.LG, stat.ML パーマリンク