要約
タイトル: Sparse Dataを用いた学習ベースのUKFアルゴリズムによるロボットシステムの残差誤差予測に向けて
要約:
– 実際のロボットに近い高精度な動的モデルまたはシミュレータモデルを作成することは、(例えば、モデル予測制御や線形二次レギュレータなどの)モデルベースの制御、モデルベースの軌道計画(例えば軌道最適化)を促進し、強化学習手法に必要な学習時間を減らすことができる。
– したがって、この研究の目的は、動的モデルまたはシミュレータモデルと実際のロボットとの残差誤差を学習することである。
– これは、ニューラルネットワークを使用して達成され、ニューラルネットワークのパラメータはUKFアルゴリズムを介して更新される。
– この方法を使用することで、わずかなデータだけでもこれらの残差エラーをモデル化することができる。これは、現実のオペレーションから直接学習して、シミュレータ/動的モデルを改善する必要があるためである。
– この手法を、ロボットハードウェア(例えば、マニピュレータアームや走行ロボットなど)でデモンストレーションし、学習された残差エラーを用いて、動的モデル、シミュレーション、現実のハードウェアの間のリアリティギャップをさらに縮小することができることを示した。
要約(オリジナル)
Achieving highly accurate dynamic or simulator models that are close to the real robot can facilitate model-based controls (e.g., model predictive control or linear-quadradic regulators), model-based trajectory planning (e.g., trajectory optimization), and decrease the amount of learning time necessary for reinforcement learning methods. Thus, the objective of this work is to learn the residual errors between a dynamic and/or simulator model and the real robot. This is achieved using a neural network, where the parameters of a neural network are updated through an Unscented Kalman Filter (UKF) formulation. Using this method, we model these residual errors with only small amounts of data — a necessity as we improve the simulator/dynamic model by learning directly from real-world operation. We demonstrate our method on robotic hardware (e.g., manipulator arm, and a wheeled robot), and show that with the learned residual errors, we can further close the reality gap between dynamic models, simulations, and actual hardware.
arxiv情報
| 著者 | Alexander Schperberg,Yusuke Tanaka,Feng Xu,Marcel Menner,Dennis Hong | 
| 発行日 | 2023-05-08 02:40:14+00:00 | 
| arxivサイト | arxiv_id(pdf) | 
提供元, 利用サービス
arxiv.jp, OpenAI
