Composite Gaussian Processes Flows for Learning Discontinuous Multimodal Policies

要約

実世界のロボットタスクに対する制御ポリシーの学習には、マルチモーダリティ、局所的不連続性、計算効率の必要性などの課題がしばしば含まれる。これらの課題は、複数の解が共存するロボット環境の複雑さから生じる。これらの問題に対処するために、我々はロボット政策のための新しいセミパラメトリックモデルである複合ガウス過程フロー(Composite Gaussian Processes Flows:CGP-Flows)を提案する。CGP-Flowsは、OMGPs(Overlapping Mixtures of Gaussian Processes)とCNFs(Continuous Normalizing Flows)を統合し、マルチモダリティや局所的不連続性に対応する複雑な政策をモデル化することを可能にする。このハイブリッドアプローチは、OMGPの計算効率を維持しつつ、CNFの柔軟性を取り入れる。シミュレーションと実世界のロボットタスクの両方で実施された実験により、CGP-flowが制御ポリシーのモデル化における性能を大幅に向上させることが実証された。シミュレーションタスクでは、CGP-Flowがベースライン手法と比較して高い成功率を持つことが確認され、GCP-Flowの成功率はカイ二乗検定において他のベースラインの成功率と有意な差が見られた。

要約(オリジナル)

Learning control policies for real-world robotic tasks often involve challenges such as multimodality, local discontinuities, and the need for computational efficiency. These challenges arise from the complexity of robotic environments, where multiple solutions may coexist. To address these issues, we propose Composite Gaussian Processes Flows (CGP-Flows), a novel semi-parametric model for robotic policy. CGP-Flows integrate Overlapping Mixtures of Gaussian Processes (OMGPs) with the Continuous Normalizing Flows (CNFs), enabling them to model complex policies addressing multimodality and local discontinuities. This hybrid approach retains the computational efficiency of OMGPs while incorporating the flexibility of CNFs. Experiments conducted in both simulated and real-world robotic tasks demonstrate that CGP-flows significantly improve performance in modeling control policies. In a simulation task, we confirmed that CGP-Flows had a higher success rate compared to the baseline method, and the success rate of GCP-Flow was significantly different from the success rate of other baselines in chi-square tests.

arxiv情報

著者 Shu-yuan Wang,Hikaru Sasaki,Takamitsu Matsubara
発行日 2025-02-04 01:05:18+00:00
arxivサイト arxiv_id(pdf)

提供元, 利用サービス

arxiv.jp, DeepL

カテゴリー: cs.LG, cs.RO パーマリンク