要約
この論文では、予測モデルを使用したポリシーの修復に焦点を当てた、安全性を意識したロボット学習の新しい方法を紹介します。
私たちの手法は、2 段階の教師あり学習フレームワークで、行動のクローニングとニューラル ネットワークの修復を組み合わせたものです。
まず専門家のデモンストレーションからポリシーを学習し、次に予測モデルに基づいて修復を適用して安全上の制約を強化します。
予測モデルには、固有受容状態や衝突の可能性など、ロボット学習アプリケーションに関連するさまざまな側面を含めることができます。
私たちの実験結果は、学習されたポリシーが、移動ロボットのナビゲーションと現実世界の下肢義足という 2 つのアプリケーションで、事前に定義された一連の安全制約にうまく準拠していることを示しています。
さらに、私たちの方法はロボットとの繰り返しの対話を効果的に減らし、学習プロセス中の大幅な時間の節約につながることを示しました。
要約(オリジナル)
This paper introduces a new method for safety-aware robot learning, focusing on repairing policies using predictive models. Our method combines behavioral cloning with neural network repair in a two-step supervised learning framework. It first learns a policy from expert demonstrations and then applies repair subject to predictive models to enforce safety constraints. The predictive models can encompass various aspects relevant to robot learning applications, such as proprioceptive states and collision likelihood. Our experimental results demonstrate that the learned policy successfully adheres to a predefined set of safety constraints on two applications: mobile robot navigation, and real-world lower-leg prostheses. Additionally, we have shown that our method effectively reduces repeated interaction with the robot, leading to substantial time savings during the learning process.
arxiv情報
著者 | Keyvan Majd,Geoffrey Clark,Georgios Fainekos,Heni Ben Amor |
発行日 | 2024-11-07 03:57:37+00:00 |
arxivサイト | arxiv_id(pdf) |
提供元, 利用サービス
arxiv.jp, Google