要約
モデルベースの強化学習と制御は、ロボット工学設定を含む、さまざまな逐次的意思決定の問題領域で大きな可能性を示しています。
ただし、現実世界のロボット システムには、これらの方法の適用性を制限する課題が存在することがよくあります。
特に、多くの産業システムで同時に発生する 2 つの問題に注目します。1) 不規則/非同期の観察と動作、2) エピソードから別のエピソードへの環境ダイナミクスの劇的な変化 (ペイロードの慣性特性の変化など)。
我々は、連続時間の予測と制御のためのメタ学習適応ダイナミクスモデルによってこれらの困難を克服する一般的なフレームワークを提案します。
提案されたアプローチはタスクに依存せず、直接的な方法で新しいタスクに適応できます。
2 つの異なるロボット シミュレーションと実際の産業用ロボットでの評価を示します。
要約(オリジナル)
Model-based Reinforcement Learning and Control have demonstrated great potential in various sequential decision making problem domains, including in robotics settings. However, real-world robotics systems often present challenges that limit the applicability of those methods. In particular, we note two problems that jointly happen in many industrial systems: 1) Irregular/asynchronous observations and actions and 2) Dramatic changes in environment dynamics from an episode to another (e.g. varying payload inertial properties). We propose a general framework that overcomes those difficulties by meta-learning adaptive dynamics models for continuous-time prediction and control. The proposed approach is task-agnostic and can be adapted to new tasks in a straight-forward manner. We present evaluations in two different robot simulations and on a real industrial robot.
arxiv情報
著者 | Achkan Salehi,Steffen Rühl,Stephane Doncieux |
発行日 | 2023-10-23 10:02:22+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google