Learning Differentiable Particle Filter on the Fly

要約

微分可能粒子フィルターは、ニューラル ネットワークを使用して状態空間モデルのコンポーネントを構築する、逐次ベイズ推論手法の新しいクラスです。
既存のアプローチは、ほとんどがオフラインの教師付きトレーニング戦略に基づいています。
これはモデルの展開の遅延につながり、取得されたフィルターはテスト時データの分布シフトの影響を受けやすくなります。
この論文では、データの到着に応じてモデル パラメーターを更新できるように、微分可能な粒子フィルターのオンライン学習フレームワークを提案します。
技術的な制約は、オンライン推論設定には既知のグラウンド トゥルース状態情報が存在しないことです。
私たちは、教師なし損失を採用してオンライン モデル更新手順を構築することでこの問題に対処します。これには、オンライン最尤ベースのパラメータ推定のための一連のフィルタリング操作が含まれます。
提案された方法の有効性を経験的に評価し、多変量線形ガウス状態空間モデルやシミュレートされたオブジェクト追跡実験を含むシミュレーション設定で教師あり学習方法と比較します。

要約(オリジナル)

Differentiable particle filters are an emerging class of sequential Bayesian inference techniques that use neural networks to construct components in state space models. Existing approaches are mostly based on offline supervised training strategies. This leads to the delay of the model deployment and the obtained filters are susceptible to distribution shift of test-time data. In this paper, we propose an online learning framework for differentiable particle filters so that model parameters can be updated as data arrive. The technical constraint is that there is no known ground truth state information in the online inference setting. We address this by adopting an unsupervised loss to construct the online model updating procedure, which involves a sequence of filtering operations for online maximum likelihood-based parameter estimation. We empirically evaluate the effectiveness of the proposed method, and compare it with supervised learning methods in simulation settings including a multivariate linear Gaussian state-space model and a simulated object tracking experiment.

arxiv情報

著者 Jiaxi Li,Xiongjie Chen,Yunpeng Li
発行日 2023-12-14 15:06:16+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, Google

カテゴリー: 62M05, 62M20, 62M45, 65C05, cs.LG パーマリンク