要約
モデルベースの RL/制御は、ロボット工学において大きな注目を集めています。
しかし、これらのアプローチは依然としてデータ効率が低く、手作業で設計されたソリューションの説明可能性に欠けていることがよくあります。
そのため、安全性が重要な設定でのデバッグや統合が困難になります。
ただし、多くのシステムでは、環境の運動学/力学に関する事前の知識が利用可能です。
このような事前分布を組み込むと、問題の複雑さと探索の必要性が軽減され、前述の問題に対処できると同時に、物理的に意味のあるエンティティに関してエージェントが下した決定の表現が容易になります。
このホワイトペーパーの目的は、ケーススタディを通じてこの観点を説明し、サポートすることです。
実際のロボット システムに基づいてペイロード操作問題をモデル化し、MPC フレームワークにおける環境のダイナミクスに関する事前知識を活用すると、説明可能性、安全性、データ効率が向上し、より少ないデータで一般化特性を満たすことができることを示します。
。
要約(オリジナル)
Model-based RL/control have gained significant traction in robotics. Yet, these approaches often remain data-inefficient and lack the explainability of hand-engineered solutions. This makes them difficult to debug/integrate in safety-critical settings. However, in many systems, prior knowledge of environment kinematics/dynamics is available. Incorporating such priors can help address the aforementioned problems by reducing problem complexity and the need for exploration, while also facilitating the expression of the decisions taken by the agent in terms of physically meaningful entities. Our aim with this paper is to illustrate and support this point of view via a case-study. We model a payload manipulation problem based on a real robotic system, and show that leveraging prior knowledge about the dynamics of the environment in an MPC framework can lead to improvements in explainability, safety and data-efficiency, leading to satisfying generalization properties with less data.
arxiv情報
著者 | Achkan Salehi,Stephane Doncieux |
発行日 | 2024-03-28 21:16:15+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google