線形パラメータ変動動的システム (LPV-DS) は、ロボット制御における安定した時間不変運動ポリシーを学習するための有望なフレームワークです。
LPV-DS は、統計モデリングと半定値最適化を採用することで、非線形 DS を介して複雑な動きをエンコードし、システムの堅牢性と安定性を確保します。
ただし、現在の LPV-DS スキームは、モデル効率と計算効率を維持しながら軌道データを正確に解釈するという課題に直面しています。
これらの制限に対処するために、方向性を意識した混合モデル (DAMM) を提案します。これは、$d$ 次元球体 $\mathbb{S}^d$ 上のリーマン計量を活用し、非ユークリッド方向情報を効率的に組み込む新しい統計モデルです。
さらに、ギブズ サンプリングと分割/マージ提案を組み合わせたハイブリッド マルコフ連鎖モンテカルロ法を導入し、並列計算を容易にし、ほぼリアルタイムの学習パフォーマンスのためのより高速な推論を可能にします。
広範な経験的検証を通じて、DAMM を使用した改良された LPV-DS フレームワークが、以前の反復と比較して大幅に向上した学習速度を示しながら、軌跡データの物理的に意味のある表現を生成し、生成された DS のパフォーマンスを向上させることができることを実証します。
The Linear Parameter Varying Dynamical System (LPV-DS) is a promising framework for learning stable time-invariant motion policies in robot control. By employing statistical modeling and semi-definite optimization, LPV-DS encodes complex motions via non-linear DS, ensuring the robustness and stability of the system. However, the current LPV-DS scheme faces challenges in accurately interpreting trajectory data while maintaining model efficiency and computational efficiency. To address these limitations, we propose the Directionality-aware Mixture Model (DAMM), a new statistical model that leverages Riemannian metric on $d$-dimensional sphere $\mathbb{S}^d$, and efficiently incorporates non-Euclidean directional information with position. Additionally, we introduce a hybrid Markov chain Monte Carlo method that combines the Gibbs Sampling and the Split/Merge Proposal, facilitating parallel computation and enabling faster inference for near real-time learning performance. Through extensive empirical validation, we demonstrate that the improved LPV-DS framework with DAMM is capable of producing physically-meaningful representations of the trajectory data and improved performance of the generated DS while showcasing significantly enhanced learning speed compared to its previous iterations.
著者 | Sunan Sun,Haihui Gao,Tianyu Li,Nadia Figueroa |
発行日 | 2023-09-05 22:53:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google